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本 书 以 Python 3.5 为 编程 环境 ， 从 基本 的 程序 设计 思想 入 手 ， 逐 步 展开 Python 语言 教学 ， 是 一 本 面 
回 广 大 编程 学 习 者 的 程序 设计 类 图 书 。 本 书 以 案例 带动 知识 点 的 讲解 ， 将 Python 知识 点 分 解 到 各 个 不 同 
的 和 案例， 每 个 案例 各 有 侧重 点 ， 同 时 展示 实际 项 目的 设计 思想 和 设计 理念 ， 使 读者 可 以 举一反三 。 

本 书 案例 具有 实用 性 ， 例 如 校园 网 搜索 引擎 、 小 小 翻译 占 、 抓 取 白 度 图 片 这 些 息 虫 案例 略 加 修改 可 
以 应 用 到 实际 项 目 中 ; 还 有 通过 微 信 通信 协议 开发 微 信 机 器 人 、 机 器 学 习 的 文本 分 类 、 基 于 卷 积 神经 网 
络 的 手写 体 识别 等 案例 ; 男 外 是 一 些 大 家 耳熟能详 的 游戏 案例 ， 例 如 连连 看 、 推 钉子、 中 国 象棋 、 网 络 
五 子 棋 、 两 人 麻将 、 人 物 拼 图 和 飞机 大 战 等 游戏 。 通 过 本 书 ， 读 者 将 掌握 Python 编程 技术 和 技巧 ， 学 会 
面 癌 对 象 的 设计 方法 ， 了 解 程序 设计 的 所 有 相关 内 容 。 本 书 不 仅 为 读者 列 出 了 完整 的 代码 ， 同 时 对 所 有 
的 源 代码 都 进行 了 非常 详细 的 解释 ， 通 俗 易 懂 、 图 文 并 成 。 扫 描 每 章 提 供 的 二 维 码 可 观看 知识 点 的 视频 
讲解 。 

本 书 适用 于 Python 语言 学 习 者 、 程 序 设 计 人 员 和 游戏 编程 爱好 者 。 
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Python 语言 从 20 世纪 90 年 代 初 诞生 人 至今 ， 逐 渐 被 广泛 应 用 于 处 理 系统 管理 任务 和 科 
学 计算 ， 是 最 受 欢迎 的 程序 设计 语言 之 一 。 

学 习 编 程 是 工程 专业 学 生 学 习 的 重要 部 分 ， 除 了 直接 应 用 外 ， 学 习 编 程 是 了 解 计 算 机 
科学 本 质 的 方法 。 计 算 机 科学 对 现代 社会 产生 了 毋 良 置 疑 的 影响 。Python 是 新 兴 的 程序 设 
计 语 言 ， 是 一 种 解释 型 、 面 回 对 象 、 动 态 数据 类 型 的 高 级 程序 设计 语言 。 由 于 Python 语言 
简洁 、 易 读 并 且 可 扩展 ， 在 国外 用 Python 做 科学 计算 的 研究 机 构 日 益 增 多 ， 最 近 几 年 其 社 
会 坝 求 逐渐 增加 ,许多 国内 高 校 纷 纷 开 设 Python 程序 设计 课程 。 本 书 编者 长 期 从 事 程序 设 
计 语 言 的 教学 与 应 用 开发 ， 了 解 在 学 习 编 程 的 时 候 什 么 样 的 书 能 够 提高 Python 开发 能 力 ， 
以 最 少 的 时 间 投 入 得 到 最 快 的 实际 应 用 。 

本 书 内 容 : 

第 1 章 是 Python 基础 知识 ， 主 要 讲解 Python 的 基础 语法 和 面 回 对 象 编程 基础 、 图 形 
界面 设计 、Python 文件 的 使 用 、Python 的 第 三 方 库 等 知识 ， 读 者 可 以 轻松 掌握 。 

从 第 2 章 开 始 是 实用 项 目 案 例 开发 ， 综 合 应 用 前 面 所 学 的 知识 ， 并 且 每 章 都 有 突出 的 
新 知识 点 ,例如 侧重 数据 库 应 用 的 案例 “智力 问答 测试 ”、 应 用 息 虫 技术 开发 的 案例 “校园 
网 搜索 引擎 ” 应 用 itchat 开发 的 案例 “ 微 信 机 器 人 ”、 机 器 学 习 案 例 “ 基 于 杆 素 贝 叶 斯 算 
法 的 文本 分 类 ”、 深 度 学 习 案 例 “ 基 于 卷 积 神经 网 络 的 手写 体 识别 ”等 ， 还 有 经 典 的 、 大 家 
耳熟能详 的 游戏 案例 ， 例 如 连连 看 、 推 箱子、 中 国 象 棋 、 两 人 有 犬 将 、 人 物 拼 图 、 网 络 五 子 
棋 、 飞 机 大 战 等 。 

本 书 特点 : 

(1) Python 程序 设计 涉及 的 范围 非常 广泛 ， 本 书 内 容 的 编排 并 不 求全 、 求 深 ， 而 是 考 
虑 零 基 础 读者 的 接受 能 力 ， 语 言 的 语法 介绍 以 够 用 、 实 用 为 原则 ， 选 择 Python 中 必 备 、 实 
用 的 知识 进行 讲解 ， 强 化 对 程序 思维 能 力 的 培养 。 

(2) 案例 选取 贴近 生活 ， 有 助 于 提高 谈 者 的 学 习 兴 趣 。 

(3) 书 中 每 个 案例 均 提 供 了 详细 的 设计 思路 、 关 键 技术 分 析 以 及 有 具体 的 解决 方案 。 

需要 说 明 的 是 ， 学 习 编 程 是 一 个 实践 的 过 程 ， 而 不 仅仅 是 看 书 、 看 资料 ， 亲 自动 手 编 
写 、 调 试 程序 才 是 至 关 重 要 的 。 通 过 实际 的 编程 和 积极 的 思考 ， 恋 者 可 以 很 快 地 和 营 握 许多 
宝贵 的 编程 经 验 ， 这 种 编程 经 验 对 开发 者 来 说 尤其 不 可 或 缺 。 

本 书 由 郊 秋生 和 夏 敏捷 (中 原 工学 院 ) 主持 编写 ， 吴 婷 (中原 工 学 院 ) 编写 第 6 章 ， 
娠 云 飞 〈 中 原 工学 院 ) 编写 第 8 章 ， 周 延 萍 编写 第 9、10 章 ， 宋 宝 卫 (郑州 轻工业 学 院 ) 
编写 第 11 一 1 章 ， 陈 海 蕊 (中 原 工学 院 ) 编写 第 16、17 章 ， 高 艳 霞 〈 中 原 工学 院 ) 编写 
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第 18 章 , 李 娟 (中原 工 学 院 ) 编写 第 19 章 ， 郑 秋生 编写 第 20 章 ， 其 余 章 节 由 夏 敏捷 编写 。 
在 本 书 的 编写 过 程 中 ， 为 确保 内 容 的 正确 性 ， 参 阅 了 很 多 资料 ， 并 且 得 到 了 中 原 工学 院 的 
教材 资助 和 资深 Python 程序 员 的 文 持 ， 在 此 说 问 他 们 表示 衷心 的 感谢 。 本 书 的 学 习 资 源 可 
以 扫 手 封底 课件 二 维 人 码 获 取 。 由 于 编者 水 平 有 限 ， 书 中 难免 有 人 不足 之 处 ， 冤 请 广大 读者 批 
评 指正 ， 在 此 表示 感谢 。 
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Python 是 一 门路 平台 、 开 源 、 免 费 的 解释 型 高 级 动态 编程 语言 ，Python 作为 动态 语言 
更 适合 初学 编程 者 。Python 可 以 让 初学 者 把 精力 集中 在 编程 对 象 和 思维 方法 上 ， 而 不 用 担 
心 语法 、 类 型 等 外 在 因素 。Python 易于 学 习 ， 拥 有 大 量 的 库 ， 可 以 高 效 地 开发 各 种 应 用 
程序 。 


1.1 Python 语言 简介 


Python 由 吉 多 范 罗 。 苏 姆 (Guido van Rossum ) 于 1989 年 底 发 明 ， 被 广泛 应 用 于 处 理 
系统 管理 任务 和 科学 计算 ， 是 最 受 欢 迎 的 程序 设计 语言 之 一 。2011 年 1 月 ， 它 被 TIOBE 
编程 语言 排行 榜 评 为 2010 年 度 语言 。 目 从 2004 年 以 后 , Python 的 使 用 率 呈 线性 增长 , TIOBE 
最 近 公 布 的 2018 年 9 月 编程 语言 指数 排行 榜 中 ，Python 超越 C++， 首 次 排名 处 于 第 三 位 
(前 两 位 是 Java 和 C)。2017 年 7 月 ， 根 据 正 EE Spectrum 发 布 的 研究 报告 显示 ，Python 已 
经 成 为 世界 上 最 有 党 欢迎 的 语言 。 

Python 文 持 命令 式 编程 、 函 数 式 编程 ， 完 全 文 持 面 加 对 象 程序 设计 ， 语 法 何洁 清晰 ， 
并 且 拥 有 大 量 的 几乎 文 持 所 有 领域 应 用 开发 的 成 熟 扩 展 库 。 

Python 为 用 户 提供 了 非常 完善 的 基础 代码 库 ， 履 盖 了 网 络 、 文 件 、GUI、 数 据 库 、 文 
本 等 大 量 内 容 ， 用 Python 开发 ， 许 多 功能 不 必 从 零 编 写 ， 直 接 使 用 现成 的 即 可 。 除 了 内 置 
的 库 外 ，Python 还 有 大 量 的 第 三 方 库 ， 也 就 是 别人 开发 的 ， 大 家 可 以 直接 使 用 的 库 。 当 然 ， 
也 可 以 自己 开发 代码 通过 很 好 地 封装 ， 作 为 第 三 方 库 给 别人 使 用 。Python 就 像 胶 水 一 样 ， 
可 以 把 用 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 缝 拼接， 更 好 地 发 挥 不 同 语言 和 工具 
的 优势 ,满足 不 同 应 用 领域 的 需求 。 所 以 ,Python 程序 看 上 去 简单 易 懂 ,， 初学 者 学 Python， 
不 但 入 门 容易 ， 而 且 将 来 深入 下 去 ， 可 以 编写 那些 非常 复杂 的 程序 。 

Python 同时 文 持 伪 编 译 ， 将 Python 源 程 序 转换 为 字 节 码 来 优化 程序 和 提高 运行 速度 ， 
可 以 在 没有 安装 Python 解释 器 和 相关 依赖 包 的 平台 上 运行 。 
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Python 语言 的 应 用 领域 主要 如 下 。 

(1) Web 开发 : Python 语言 文 持 网 站 开发 ， 比 较 流行 的 开发 框架 有 web2py、Django 
等 。 许 多 大 型 网 站 就 是 用 Python 开发 的 ， 例 如 YouTube、Instagram 等 。 很 多 大 公司 ， 例 如 
Google、Yahoo 等 ， 甚 至 NASA (美国 航空 航天 局 ) 都 大 量 地 使 用 Python。 

(2) 网 络 编程 : Python 语言 提供 了 socket 模块 ， 对 Socket 接口 进行 了 两 次 封装 ， 文 持 
Socket 接口 的 访问 ; 还 提供 了 urllib、httplib、scrapy 等 大 量 模块 ， 用 于 对 网 页 内 容 进 行 读 
取 和 处理 ， 并 可 以 结合 多 线程 编程 以 及 其 他 有 关 模 块 快速 开发 网 页 扑 虫 之 类 的 应 用 程序 ; 
可 以 使 用 Python 语言 编写 CGI 程序 ， 也 可 以 把 Python 程序 舱 入 到 网 页 中 运行 。 

(3) 科学 计算 与 数据 可 视 化 : Python 中 用 于 科学 计算 与 数据 可 视 化 的 模块 很 多 ， 例 如 
NumPy、SciPy、Matplotlib、Traits、TVIK、Mayavi、VPython、OpenCV 等 ， 涉 及 的 应 用 
领域 包括 数值 计算 、 符 号 计算 、 二 维 图 表 、 三 维 数据 可 视 化 、 三 维 动 男 演 示 、 图 像 处 理 以 
及 界面 设计 等 。 

(4) 数据 库 应 用 : Python 数据 库 模块 有 很 多 ， 例 如 可 以 通过 内 置 的 sqlite3 | 问 
SQLite 数据 库 ; 使 用 pywin32 模块 访问 Access 数据 库 ; 使 用 pymysql 模块 
访问 MySQL 数据 库 ; 使 用 pywin32 和 pymssql 模块 访问 SQL Server 数据 库 。 

(5) 多 媒体 开发 : PyMedia 模块 可 以 对 WAV、MP3、AVI 等 多 媒体 格 
式 文件 进行 编码 、 解 码 和 播放 ; PyOpenGL 模块 封装 了 OpenGL 应 用 程序 Hr I 
编程 接口 ， 通 过 该 模块 可 以 在 Python 程序 中 集成 二 维 或 三 维 图 形 ; PIL 视频 讲解 
(Python Imaging Library，Python 图 形 库 ) 为 Python 提供 了 强大 的 图 像 处 理 
功能 ， 并 提供 广泛 的 图 像 文件 格式 文 持 。 

(6) 电子 游戏 应 用 : Pygame 就 是 用 来 开发 电子 游戏 软件 的 Python 模块 ， 使 用 Pygame 
模块 可 以 在 Python 程序 中 创建 功能 丰富 的 游戏 和 多 媒体 程序 。 

Python 有 大 量 的 第 三 方 库 ， 可 以 说 需要 什么 应 用 就 能 找到 什么 Python 库 。 


1.2 ”Python 语法 基础 


1.2.1 Python 数据 类 型 


计算 机 程序 理所当然 地 可 以 处 理 各 种 数值 。 计 算 机 能 处 理 的 远 不 止 数 
值 ， 还 可 以 处 理 文本 、 图 形 、 音 频 、 视 频 、 网 页 等 各 种 各 样 的 数据 ， 不 同 ee 
的 数据 需要 定义 不 同 的 数据 类 型 。 视频 讲解 

@ 数值 类 型 

Python 数值 类 型 用 于 存储 数值 ，Python 文 持 以 下 数值 类 型 。 

。 整 型 (int): 通 单 被 称 为 整 型 或 整数 ， 是 正 或 负 整 数 ， 不 市 小 数 点 。 在 Python3 中 只 

有 一 种 整数 类 型 (int)， 没 有 Python2 中 的 long。 
。 学 点 型 (float): 浮 点 型 由 整数 部 分 与 小 数 部 分 组 成 ,， 浮 点 型 也 可 以 使 用 科学 记 数 法 
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表示 (2.78E2 就 是 2.78X 10=278 )。 
。 复数 (complex): 复数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 at+bj 或 者 complex(a,b) 
表示 ， 复 数 的 虚 部 以 字母 j 或 结尾， 例如 2+3j。 
数据 类 型 是 不 允许 改变 的 ， 这 束 总 味 看 如 果 改 变数 值 数 据 类 型 的 值 ， 将 重新 分 配 内 存 
空间 。 
@ 字符 串 
字符 串 是 Python 中 最 常用 的 数据 类 型 。 用 户 可 以 使 用 引号 来 创建 字符 串 。Python 不 文 
持 字 从 类 型 ,单字 符 在 Python 也 是 作为 一 个 字符 串 使 用 。Python 使 用 单 引 号 和 双 引 号 来 表 
示 字 符 串 是 一 样 的 。 
全 布尔 类 型 
Python 文 持 布尔 类 型 的 数据 ， 布 尔 类 型 只 有 True 和 False 两 种 值 ， 但 是 布尔 类 型 有 以 
下 几 种 运算 。 
(1) and (与 ) 运算 : 只 有 两 个 布尔 值 都 为 True 时 计算 结果 才 为 True。 


True and True # 结 果 是 True 

True and False # 结 果 是 False 

False and True # 结 果 是 False 

False and False # 结 果 是 False 

(2) or (或 ) 运算 : 只 要 有 一 个 布尔 值 为 Tme， 计 算 结 果 就 是 True。 
True or True # 结 果 是 True 

True or False # 结 果 是 True 

False or True # 结 果 是 True 

False or False # 结 果 是 False 

(3) not (〈 非 ) 运算 : 把 True 变 为 False， 或 者 把 False 变 为 True。 
not True # 结 果 是 False 

FD alge # 结 果 是 True 


布尔 运算 在 计算 机 中 用 来 做 条 件 判 断 ， 根 据 计算 结果 为 True 或 者 False， 计 算 机 可 以 
目 动 执行 不 同 的 后 续 代 码 。 

在 Python 中， 布尔 类 型 还 可 以 与 其 他 数据 类 型 做 and、or 和 not 运算， 这 时 下 面 的 几 
种 情况 会 被 认为 是 False: 为 0 的 数字 ， 包 括 0、0.0; 衬 字 符 串 ''"、""; 表示 空 值 的 None; 
空 集合 ， 包 括 空 元 组 、 空 序列 []、 空 字典 从。 其 他 的 值 都 为 Tme。 例 如 : 


a="'python" 

print (a and True) # 结 果 是 True 
b="" 

print (b or False)  # 结 果 是 False 
@ 空 值 


空 值 是 Python 中 的 一 个 特殊 值 ， 用 None 表示 。 它 不 支持 任何 运算 ， 也 没有 任何 内 置 
函数 方法 。None 和 任何 其 他 数据 类 型 比较 永远 返回 False。 在 Python 中 未 指定 返回 值 的 函 
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数 会 目 动 返回 None。 


1.2.2 友 列 数据 结构 


数据 结构 是 计算 机 存储 、 组 织 数据 的 方式 。 序列 是 Python 中 最 基本 的 数据 结构 。 序 列 
中 的 每 个 元 素 都 分 配 一 个 数字 ， 即 它 的 位 置 或 索引 ,第 1 个 索引 是 0, 第 2 个 索引 是 1, 依 
此 类 推 。 友 列 都 可 以 进行 的 操作 包括 索引 、 截 取 (切片 )、 加 、 乘 、 成员 检 查 。 此 外 ，Python 
己 经 内 置 确 定 序 列 的 长 度 以 及 确定 最 大 和 最 小 元 系 的 方法 。Python 内 置 序列 类 型 最 币 见 的 
是 列表 、 元 组 和 字符 串 。 另 外 ，Python 提供 了 字典 和 集合 这 样 的 数据 结构 ， 
序 的 数据 集合 体 ， 不 能 通过 位 置 索 引 来 访问 数据 元 素 。 

@ 列表 

列表 (List) 是 最 音 用 的 Python 数据 类 型 ， 列 表 的 数据 项 不 需要 具有 
相同 的 类 型 。 列 表 类 似 其 他 语言 的 数组 ， 但 功能 比 数组 强大 得 多 。 

创建 一 个 列表 , 只 要 把 喜 号 分 隔 的 不 同 数据 项 使 用 方 括号 括 起 来 即 可 ， 
实例 如 下 。 

list1=[' 中 国 "，' 美 国 '",，1997,，2000]; 

er i 

We 

列表 索引 从 0 开始。 列表 可 以 进行 截取 (切片 )、 组 合 等 。 

1) 访问 列表 中 的 值 

使 用 下 标 索 引 来 访问 列表 中 的 值 ， 同 样 可 以 使 用 方 括号 的 形式 截取 字符 ， 实 例如 下 。 

1ist1=[' 中 国 '，' 美 国 '，1997,，2000]; 

tol Ton yao 

ETEIREI TESTLIOE Lotlr0ly 

Prantlo SET Sl elim 

以 上 实例 的 输出 结果 

listl1[0]: 中 国 

了 机 Ne ee 

2) 更 新 列表 

可 以 对 列表 的 数据 项 进行 修改 或 更 新 ， 实 例如 下 。 

ist Ti" enhesEry 1997 20001- 

print ("Value available at index 2 : ") 

Print(tlisttl21) 

1]ist[2]=2001; 


print ("New value avallable at index 2 : ") 
print(tliastti21) 


以 上 实例 的 输出 结果 : 


ER 
1997 


| 4 
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New Voile availiaDie dL Indexr 2 
2001 


3) 删除 列表 元 素 

方法 一 : 使 用 del 语句 来 删除 列表 中 的 元 素 ， 实 例如 下 。 
1ist1=[ "中 国 "'，“ 美国 ' ， 1997，2000] 

print (list1) 

del J]ist1[12] 

print ("After deleting value at index 2 : ") 
ER SEE 

以 上 实例 的 输出 结果 : 

[ 王 中国" 天 国 5 1997 2000] 


After deleting value at index 2 : 


[' 中 国 '*，' 美 国 "，2000] 
方法 二 : 使 用 remove0 方 法 来 删除 列表 中 的 元 素 ， 实 例如 下 。 


list1=[' 中 国 '，' 美 国 '，1997,，2000] 
11st1l1 .remove (1997) 

list1l1.remove (' 美 国 ') 

print (11ist1) 


以 上 实例 的 输出 结果 : 
[' 中 国 '，2000] 
方法 三 :使 用 pop0 方 法 来 删除 列表 中 指定 位 置 的 元 素 ， 无 参数 时 删除 最 后 一 个 元 素 ， 


实例 如 下 。 


list1=["' 中 国 "，' 美 国 '",，1997,，2000] 

11st]1 .pop (2) # 删 除 位 置 2 的 元 素 1997 
list1 .pop() # 删 除 最 后 一 个 元 素 2000 
print(list1) 

以 上 实例 的 输出 结果 : 


[' 中 国 '，' 美 国 '] 
4) 添加 列表 元 素 
可 以 使 用 append0 方 法 在 列表 的 末尾 添加 元 素 ， 实 例如 下 。 


1List1=[ 中 国 '， “美国 ' ”1997，2000] 
11st1l1.append(2003) 
print (list1) 


以 上 实例 的 输出 结果 : 
[' 中 国 '，' 美 国 '，1997，2000，2003] 


5) 定义 多 维 列表 
可 以 将 多 维 列 表 视 为 列表 的 散 套 ， 即 多 维 列表 的 元 素 值 也 是 一 个 列表 ， 只 是 维度 比 父 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


列表 小 一 。 二 维 列 表 〈 即 其 他 语言 的 二 维 数组 ) 的 元 素 值 是 一 维 列 表 ， 三 维 列表 的 元 素 值 
是 二 维 列 表 。 例 如 定义 一 个 二 维 列表 。 


1ist2=[["CPU"，" 内 存 "] ， [" 硬 盘 ", "声卡 "]] 

二 维 列表 比 一 维 列表 多 一 个 索引 ， 可 以 如 下 获取 元 素 : 
列表 名 [索引 1] [索引 2] 

例如 定义 3 行 6 列 的 二 维 列表 ， 打 印 出 元 素 值 。 


rows=3 
COl1s=6 
matrix=[[0 for col in range(cols)] for row in range (rows)] 
# 列 表 生 成 式 生 成 二 维 列 表 
for 1 in range (rows): 
for ] in range(cols): 
matrix[1i][]]=i*3+] 
print (matrix[1i] []],end=",") 
porn AR 
以 上 实例 的 输出 结果 : 
0 L727 3r 4D 


“要 本 :本 Er :有 
cp T 


列表 生成 式 (List Comprehensions) 是 Python 内 置 的 一 种 极其 强大 的 生成 列表 的 表达 
式 。 如 果 要 生成 一 个 list [1 ,2,3,4,5,6,7,8,9]， 可 以 用 range(1,10): 


>>> T=1ist(lrange(l, 10)) #1 2 3 4 959 6 1 659] 
如 果 要 生成 [1 X1,2X2,3X3 ,… ,10X10]， 可 以 使 用 循环 : 
>>> L=[] 


>>> Tor x in range(l. 10)-: 
L.append (x*x) 

> 

Ti lo 25 0 A Al 


列表 生成 式 ， 可 以 用 以 下 语句 代 葵 以 上 烦琐 的 循环 来 完成 : 


> > 
.| 6 ET 4 


列表 生成 式 的 书写 格式 为 把 要 生成 的 元 素 x*x 放 到 前 面 ， 后 面 跟 上 for 循环 。 这 样 就 
可 以 把 列表 创建 出 来 。for 循环 后 面 还 可 以 加 上 下 判断 ， 例 如 筑 选 出 偶数 的 平方 : 


>>> [x*x for x In rangqde(1,11) if x%2==0] 
[4, 16, 36, 64, 100] 


再 如 ， 把 一 个 列表 中 的 所 有 字符 串 变 成 小 写 形式 : 
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>>> LIL=[" Hello"， "World'"， 'IBM', "Apple'"] 
pp Eo<SENAD 


Luheillon worlas bn "apple'l 
当然 ， 列 表 生 成 式 也 可 以 使 用 两 层 循环 ， 例 如 生成 ,ABC' 和 'XYZ' 中 字母 的 全 部 组 合 : 


> Drinttimn For min ABC CEOr nm Xr. 1 》 
EA RN 


for 循环 其 实 可 以 同时 使 用 两 个 甚至 多 个 变量 ,例如 字典 (Dict) 的 itemsO 可 以 同时 失 


代 key 和 value: 


改 。 元 组 使 用 小 括号 0， 列 表 使 用 方 括号 [] 。 元 组 中 的 元 素 类 型 也 可 以 不 


人 i ye 'B', zi ter # 字 典 
> ET ELITE 
print (k， ' 键 ='，v，end1='7 7) 


程序 的 运行 结果 : 

y 键 =B; x 键 =A; z 键 =C; 

因此 ， 列 表 生 成 式 也 可 以 使 用 两 个 变量 来 生成 列表 : 

Sy d={"'x": 'A', 二 BE Mp Ee 

>>> [k+'='+Vv for k, Vv in d.items ()] 

[vB 二 并 下 ee 

@ 元 组 

Python 的 元 组 (tuple) 与 列表 类 似 ， 不 同 之 处 在 于 元 组 的 元 了 率 不 能 修 


1) 创建 元 组 视频 讲解 
元 组 的 创建 很 简单 ， 只 需要 在 括号 中 添加 元 素 ， 并 使 用 逗号 隔 开 即 可 ， 实 例如 下 。 
ET 下 国 汪 国人) 

a 

tup3="a", et i a 

如 果 是 创建 空 元 组 ， 只 需 写 个 空 插 号 即 可 。 

Eun 

当 元 组 中 只 包含 一 个 元 素 时 ， 需 要 在 第 1 个 元 素 后 面 添 加 去 号 。 

Euyl=(505) 

元 组 与 字符 串 类 似 ， 下 标 索 引 从 0 开始 ， 可 以 进行 截取 、 组 合 等 。 

2) 访问 元 组 

元 组 可 以 使 用 下 标 索 引 来 访问 元 组 中 的 值 ， 实 例如 下 。 


Ed 三 (中 国生 7 天国 呈 19g7 2000) 
站 用 ?六 二 和 


PP 项 目 案例 开发 
从 入 门 到 实战 一 爬虫 、 游 戏 和 机 器 学 习 


print ("tupl[0]: ", tupl[0]) # 输 出 元 组 的 第 1 个 元 素 

Brn HDI ol 31) # 切 片 ， 输 出 从 第 2 个 元 素 开始 到 第 5 个 元 素 
print (taup2[2:]1) # 切 片 ， 输 出 从 第 3 个 元 素 开始 的 所 有 元 素 
Drint ltup2 2 2) # 输 出 元 组 两 次 

以 上 实例 的 输出 结果 : 


tupl[0]: 中国 

Le 

发 
OO 


3) 连接 元 组 
元 组 中 的 元 素 值 是 不 允许 修改 的 ， 但 可 以 对 元 组 进行 连接 组 合 ， 实 例如 下 。 


tupl=(12, 34, 0) 
tup2=(718, 90) 


#tupl[0]=100 # 修 改元 组 中 元 素 的 操作 是 非法 的 
tup3=tupl+tup2 # 连 接 元 组 ， 创 建 一 个 新 的 元 组 
Printltup3) 

以 上 实例 的 输出 结果 : 


1 大 人 ] 


4) 删除 元 组 

元 组 中 的 元 素 值 是 不 允许 删除 的 ， 但 可 以 使 用 del 语句 来 删除 整个 元 组 ， 实 例如 下 。 
Eup={" 中 国 " “美国 "， 1997。 2000); 

print (tup)}) 

del tup 


BEI Ser el ein Lo -Ny 
Print (ta 


以 上 实例 元 组 被 删除 后 ， 输 出 变量 会 有 有 弄 币 信息 ， 输 出 如 下 。 


('" 中 国 ' ，“' 美 国 '，1997，2000) 
After deleting tup : 


NameError: name "tup' 1s not defined 


5) 元 组 与 列表 的 转换 

因为 元 组 数 不 能 改变 ， 所 以 将 元 组 转换 为 列表 从 而 可 以 改变 数据 。 实 际 上 上， 列表、 元 
组 和 字符 串 之 间 可 以 互相 转换 ， 需 要 使 用 3 个 函数 ， 即 str()、tupleO 和 listO。 

可 以 使 用 下 面 的 方法 将 元 组 转换 为 列表 : 

列表 对 象 =1ist (元 组 对 象 ) 


例如 : 

tup=(1, Ee i 4， 3 

Ts = 11iSt (eng) # 元 组 转换 为 列表 

print (1ist1) Tl 


| 8 


第 1 章 Python 基础 知识 0 1 


可 以 使 用 下 面 的 方法 将 列表 转换 为 元 组 : 
元 组 对 象 =tuple (列表 对 象 ) 
例如 : 


nme=ii,， 3 5 7 0 13 301 
print (tuple (nums)) # 列 表 转 换 为 元 组 ， 返 回 (1，3，5，7，8，13，20) 


将 列表 转换 成 字符 串 如 下 : 


ne 1 Co 

strl=str (nums) # 列 表 转 换 为 字符 串 ， 返 回 含 中 括号 及 逗号 的 ' [1，3，5，7，8， 
#13， 20] ' 字 符 串 

ER elLT21) # 打 印 出 逗号 ， 因 为 字符 串 中 索引 号 为 2 的 元 素 是 逗号 

num2=[' 中 国 '"，' 美 国 '，' 日 本 '，' 加 拿 大 '] 


str2="%" 
str2=str2.join(num2)  # 用 百 分 号 连接 起 来 的 字符 串 ' 中 国 $ 美 国 $ 日 本 $ 加 拿 大 ' 
str2="" 

str2=str2.join(num2) ” # 用 空 字符 连接 起 来 的 字符 串 ' 中 国美 国 日 本 加 拿 大 ' 

© 字典 


Python 字典 (dict) 是 一 种 可 变 容 器 模型 ， 且 可 存储 任意 类 型 对 象 ， 例 
如 字符 串 、 数 字 、 元 组 等 其 他 容器 模型 。 字 典 也 被 称 为 关联 数组 或 哈 希 表 。 

1) 创建 字典 

字典 由 键 和 对 应 值 (key=>value) 成 对 组 成 。 在 字典 的 每 个 键 / 值 对 中 ， 
键 和 值 用 冒号 分 隔 ， 键 / 值 对 之 间 用 逗号 分 隔 ， 整 个 字典 包括 在 花 括号 中 。 
其 基本 语法 如 下 : 

d={keyl: valuel, key2: value2} 

注意 : 键 必须 是 唯一 的 ， 值 则 不 必 。 值 可 以 取 任 何 数 据 类 型 ， 但 键 必须 是 不 可 变 的 ， 
例如 字符 串 、 数 字 或 元 组 。 

一 个 简单 的 字典 实例 : 

GeL=T xml dd0O zhang 9 Wang” > BOD} 

当然 也 可 以 如 此 创建 字典 : 

ms se 

站 CE "abe 3 SI 

字典 有 如 下 特性 : 

(1) 字典 值 可 以 是 任何 Python 对 象 ， 例 如 字符 串 、 数 字 、 元 组 等 。 

(2) 不 允许 同一 个 键 出 现 两 次 ， 在 创建 时 如 果 同 一 个 键 被 赋值 两 次 ， 后 一 个 值 会 覆盖 
前 面 的 值 。 


dict={'Name': ‘'xm]j', 'Age': 17, 'Name': 'Manni'}; 


print("”"dictil'Nanme’l * dictl"Name’1}s 


P 项 目 案例 开发 


从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 
以 上 实例 的 和 输出 结 末 : 


eName Mann 


(3) 键 不 可 变 ， 所 以 可 以 用 数字 、 字 人 符 串 或 元 组 充当 ， 用 列表 不 行 ， 实 例如 下 。 


dict={['Name']: 'Zara', 'Age': 7}; 

以 上 实例 输出 错误 结果 : 

Traceback (most recent call last): 

File "<pyshell#0>", line 1, in <module> 

dict={['Name']: 'Zara', 'Age': 7} 

TypeError: unhashable type: 'list" 

2) 访问 字典 里 的 值 

在 访问 字典 里 的 值 时 把 相应 的 键 放 到 方 括号 中 ， 实 例如 下 。 

geEE= NE 二 人 ET RCISSA 本 

print ("dict['Name']: ", dict['Name']) 

printt”"dretl Agqe nl "dct[l Aoe 1l) 


以 上 实例 的 输出 结果 : 

dict['Name'] : 王 海 

drctl'aAge "1-1 

如 果 用 字典 里 没有 的 键 访问 数据 ， 会 输出 错误 信息 : 
os i i | 
print(l dceEli se 1 cel sex 


由 于 没有 sex 键 ， 以 上 实例 输出 错误 结果 : 


Traceback (most recent call last): 
File "<pyshell#10>", line 1, in <module> 
EECInE GCCETE SET dctl sex ly) 
KeyError: "sex" 


3) 修改 字典 


回 字 典 里 添加 新 内 容 的 方法 是 增加 新 的 键 / 值 对 ， 修 改 或 删除 已 有 键 / 值 对 ， 实 例如 下 。 


GEE Nanmen A LET 二 相机 一 和 
dict['Age']=18 # 更 新 键 / 值 对 
dict['School']=" 中 原 工 学 院 " # 增 加 新 的 键 / 值 对 

ELInEL GEEF ae ”OICEI age 1) 

FI deel Enooet ia Adel ochool > 


以 上 实例 的 输出 结果 : 


gel Me la 
dict['School']: 中 原 工 学 院 
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4) 删除 字典 中 的 元 素 
del0 方 法 允许 使 用 键 从 字典 中 删除 元 素 (条目)。clear0 方 法 清空 字典 中 的 所 有 元 素 。 
显 式 删 除 一 个 字典 用 del 命令 ， 实 例如 下 。 


ict = TName "FE" A lio Cas "i 


del dict['Name'] # 删 除 键 是 'Name' 的 元 素 〈( 和 条目) 
dict.clear() # 清 空 字 典 中 的 所 有 元 素 

del dict # 删 除 字 典 ， 用 del 删除 后 字典 不 再 存在 
$5) in 运算 


字典 里 的 in 运算 用 于 判断 某 键 是 否 在 字典 里 ， 对 于 value 值 不 适用 ， 其 功能 与 


has key (key) 相 似 。 


pe el eo A 

Brint( Agqe in Gict) # 等 价 于 Print (dict -has key('Age')) 
以 上 实例 的 输出 结果 

Te 


6) 获取 字典 中 的 所 有 值 
dict.values() 以 列表 形式 返回 字典 中 的 所 有 值 。 


dict={'Name' : ' 王 海 '，'Age': 17，'Class': ' 计 算 机 一 班 ' } 

print (dict .values ()) 

以 上 实例 的 输出 结果 : 

[17,，' 王 海 '，' 计 算 机 一 班 '] 

7) items() 方 法 

items() 方 法 把 字典 中 的 每 对 key 和 value 组 成 一 个 元 组 , 并 把 这 些 元 组 放 在 列表 中 返回 。 


Be l= 二 本 es i A ds | 
for key,value in dict.items(): 


print (key,value) 
以 上 实例 的 输出 结果 : 


Name 王 海 
class 计算 机 一 班 
Age 1]1 


注意 : 字典 打印 出 来 的 顺序 与 创建 之 初 的 顺序 不 同 ， 这 不 是 错误 。 字 典 中 的 各 个 元 素 


A we 了 优化 ,使 字典 
的 存储 和 查询 效率 最 高 。 这 也 是 字典 和 列表 的 另 一 个 区 别 : 列表 保持 元 素 的 相对 关系 ， 
序列 关系 ; 而 字典 是 es ee 
要 使 用 列表 ， 而 不 是 字典 


@ 集合 
集合 〈set) 是 一 个 无 序 不 重复 元 素 的 序列 。 集 合 的 基本 功能 是 进行 成 员 关 系 测试 和 删 
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PP 项 目 案 例 开 发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


1) 创建 集合 


可 以 使 用 大 括号 〈 峡 ) 或 者 setO 函 数 创 建 集合 。 注 意 ， 创 建 一 个 空 集合 必须 用 set0， 


而 不 是 用 ， 因 为 从 用 来 创建 一 个 空 学 上 典 。 


student={"'Tom', ‘'Jim', 'Mary'， 'Tom', 


print (student) 


以 上 实例 的 输出 结果 : 


"Jack” "Rose "Mary Jim TO 


2) 成 员 测 试 
例如 : 


TEI"ROse in Studentl le 
print ('Rose 在 集合 中 ') 
else : 


print ('Rose 不 在 集合 中 ') 
以 上 实例 的 输出 结果 : 
Rose 在 集合 中 
3) 集合 运算 


“可 可 忆 拓 7 Bose” 


# 输 出 集合 ， 重 复 的 元 素 被 自动 去 掉 


可 以 使 用 “-”“|”"“&&” 运 算 符 进行 集合 的 莽 集 、 并 集 、 交 集运 算 ， 例 如 : 


#set 可 以 进行 集合 运算 
a=set ( "abcd ' ) 
b=set ("cdef ' ) 
print (a) 


print ("a 和 DD 的 差 集 ; ", a 一 b) #a 和 bb 的 差 集 
print ("a 和 bb 的 并 集 : ", a | b) #a 和 bb 的 并 集 
print ("a 和 Db 的 交集 ; ",， a & D) #a 和 的 交集 
print ("a 和 中 不 同时 存在 的 元 素 : "，a ^ b) #a 和 b 中 不 同时 存在 的 元 素 


以 上 实例 的 输出 结果 : 


全 wt ke wk 


a 和 b 的 差 集 : {'a'，'b'} 


a 和 bb 的 并 集 : "bh. Tare 上 惑 症 i Se we 
a 和 bb 的 交集 : {'c'，'d'} 
a 和 Db 中 不 同时 存在 的 元 素 : {'a'，'e'，,'f', 'b'} 


1.2.3 ”Python 控制 语句 


对 于 Python 程序 中 的 执行 语句 ， 默 认 是 按照 书写 顺序 依次 执行 的 ， 通 常 说 这 样 的 语句 


是 顺序 结构 的 。 但 是 ， 仅 有 顺序 结构 还 不 够 ， 因 为 有 时 候 需 要 根据 特定 的 情况 有 选择 地 执 
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行 某 些 语句 ， 这 时 就 需要 一 种 选择 结构 的 语句 。 男 外 ， 有 时 候 还 可 以 在 给 
定 条 件 下 重复 执行 菜 些 语句 ， 通 常 称 这 些 语句 是 人 循 坏 结构 的 。 有 了 这 3 种 
基本 结构 ， 就 能 构建 任意 复杂 的 程序 了 。 

@ 选择 结构 

3 种 基本 程序 结构 中 的 选择 结构 ， 可 以 用 站 语句 、if…else 语句 和 1f… 
elif…else 语句 实现 。 

下 语句 是 一 种 单 选 结构 ， 它 选择 的 是 做 与 不 做 。 站 语句 的 语法 形式 如 下 : 

i Re 

语句 1 


还 语句 的 流程 图 如 图 1-1 所 示 。 


图 1-1 站 语 句 的 流程 图 
if…else 语句 是 一 种 双 选 结构 , 用 于 解决 在 两 种 备 选 行动 中 选择 哪 一 个 的 问题 。 1f*…else 
语句 的 语法 形式 如 下 : 
if 表达 式 : 
语句 1 


else: 
语句 2 


if…else 语句 的 流程 图 如 图 1-2 所 示 。 


图 1-2 if-…else 语句 的 流程 图 


[ 例 j1-1 输入 一 个 年 份 ， 判 断 是 否 为 闽 年 。 
国 年 的 年 份 必 须 满足 以 下 两 个 条 件 之 一 : 
(1) 能 被 4 整除 ， 但 不 能 被 100 整除 。 

(2) 能 被 400 整除 。 
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| 项 目 案 例 开 发 
从 入 门 到 实战 一 一 假 虫 、 游 戏 和 机 器 学 习 


分 析 : 设 变 量 year 表示 年 份 ， 判 断 year 是 否 满足 以 下 表达 式 。 
条 件 (1) 的 逻辑 表达 式 是 year%4==0&&year%100 !=0。 

条 件 (2) 的 逻辑 表达 式 是 year%400 一 0。 

两 者 取 “ 或 ?， 即 得 到 判断 国 年 的 逻辑 表达 式 : 


(Years4==0 and year®%100!=0) or year$400==0 
程序 代码 : 


year=int (input (' 输 入 年 份 :' ) ) # 输 入 x，input () 获取 的 是 字符 串 ， 所 以 需要 转换 成 整 型 
if years4==0 and year%100!=0 or years400==0: # 注 意 运算 符 的 优先 级 
EYE 7") 
三 
print (year，"” 不 是 国 年 ") 


在 判断 国 年 后 ， 也 可 以 输入 茶 年 茶 月 茶 日 ， 判 断 这 一 天 是 这 一 年 的 第 几 天 。 以 3 月 5 


日 为 例 ， 应 该 先 把 前 两 个 月 的 天 数 加 起 来 ， 然 后 再 加 上 5 天 ， 即 本 年 的 第 几 天 。 特 殊 情 况 
是 国 年 ， 在 输入 月 份 大 于 3 时 需 考 虑 多 加 一 天 。 


程序 代码 : 

WESTIDDDET Ver) # 输 入 年 
month=int (input ('month:')) # 输 入 月 
day=int (input ('day:")) # 输 入 日 


months=(0, 31,59, 90,120,151,181, 212, 243,273, 304, 334) 
if 0<=month<=12 : 
SUm=months [month - 1|] 
else: 
print (' 月 份 输入 错误 ') 
sum+=day 
leap=0 
1if (year®400==0) or ((yeargs4==0) and (year®100!=0)): 
leap=1 
if (leap==1) and (month>2) : 
sum+=1] 
print (' 这 一 天 是 这 一 年 的 第 $d 天 '$sum) 
有 时 候 需 要 在 多 组 动作 中 选择 一 组 执行 ,这 时 就 要 用 到 多 选 结构 ， 对 于 Python 语言 来 
说 就 是 f…elif…else 语句 。 该 语句 的 语法 形式 如 下 : 
if 表达 式 1: 
语句 1 
elif 表达 式 2: 
语句 2 
全 下 AT 
语句 n 


else: 
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语句 n+1 
注意 : 最 后 一 个 elif 子 句 之 后 的 else 子 名 没有 进行 条 件 判 断 ， 它 实际 上 处 理 跟 前 面 所 
有 条 件 都 不 匹配 的 情况 , 所 以 else 子 句 必须 放 在 最 后 .if…elif…else 语句 的 流程 图 如 图 1-3 
所 示 。 


真 


图 1-3” if…elif…else 语句 的 流程 图 


[ 例 ]1-2 输入 学 生 的 成 绩 score， 按 分 数 输出 其 等 级 ， 即 score 宇 90 为 优 ，90>score 二 
80 为 展 ，80>score 三 70 为 中 等 ，70>score 三 60 为 及 格 ，score<60 为 不 及 格 。 


score=int (input ("请 输入 成 绩 ") ) #int () 转换 字符 串 为 整 型 
if score>=90: 
Serntiu 
elif score>=80: 
print("RR"™) 
elif score>=70: 
print(t"q") 
elif score>=60: 
print ("及 格 ") 
else : 
EEIENETI 友和 格 = 
说 明 : 在 3 种 选择 语句 中 ， 条 件 表达 式 都 是 必 不 可 少 的 组 成 部 分 。 当 条 件 表达 式 的 值 
为 零 时 ， 表 示 条 件 为 假 ， 当 条 件 表达 式 的 值 为 非 零 时 ， 表 示 条 件 为 真 。 那 么 哪些 表达 式 可 
以 作为 条 件 表达 式 呢 ?最 常用 的 是 关系 表达 式 和 风 辑 表达 式 ， 例 如 : 
if a==x and b==y : 


print ("a=x, b=y") 


除 此 之 外 ， 条 件 表 达 式 可 以 是 任何 数值 类 型 的 表达 式 ， 字 符 串 也 可 以 : 


下 ython 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


TE a Se 二 同 以 
print ("a=x, b=y") 

另外 ，C 语言 用 花 括号 个 来 区 分 语句 体 ， 但 Python 的 语句 体 是 用 纵 进 形式 来 表示 的 ， 
如 果 缠 进 不 正确 ， 会 叶 致 逻辑 错误 。 

@@ 循环 结构 

程序 在 一 般 情况 下 是 按 顺序 执行 的 。 编 程 语言 提供 了 各 种 控制 结构 ， 
允许 更 复杂 的 执行 路 径 。 循 环 语 名 允许 用 户 执行 一 个 语句 或 语句 组 多 次 ， 
Python 提供 了 for 循环 和 while 循环 《在 Python 中 没有 do…while 循环 )。 

1 ) while 语句 

在 Python 编程 中 ，while 语句 用 于 循环 执行 程序 ， 即 在 茶 条 件 下 循环 


执行 某 段 程序 ， 以 处 理 需 要 重复 处 理 的 相同 任务 。 其 基本 形式 如 下 : 饮 频 讲解 
while 判断 条 件 : 
执行 语句 


执行 语句 可 以 是 单个 语句 或 语句 块 。 判 断 条 件 可 以 是 任何 表达 式 ， 任 何 非 零 或 非 空 的 
值 均 为 True。 当 判断 条 件 为 False 时 ， 循 环 结束 。whlle 语句 的 流程 图 如 图 1-4 所 示 。 


图 1-4 ”while 语句 的 流程 图 
同样 需要 注意 冒号 和 缩 进 ， 例 如 : 


count=0 
while count<5: 

BruntiThie conmti iss" econmtl 

count=count+1 
print ("Good bye!™") 
2) for 语句 
for 语句 可 以 遍历 任何 序列 的 项 目 , 例如 一 个 列表 、 元 组 或 者 一 个 字符 

串 。for 循环 的 语法 格式 如 下 : 

for 循环 索引 值 in 序列 

循环 体 
for 循环 会 把 列表 中 的 元 素 授 历 出 来 ,例如 以 下 代码 会 依次 打印 fruits 中 的 每 一 个 元 素 。 
fruits=['banana', '‘'apple', ‘'mango'] 
FOP EPUTLE ED # 第 2 个 实例 
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PED mt) 
print ("Good bye!™") 
程序 的 运行 结果 : 
7 元素 : banana 
元 素 : apple 
元 素 : mango 
Good bye! 


[ 例 ]1-3 计算 1 一 10 的 整数 之 和 ， 可 以 用 一 个 sum 变量 做 累加 。 
程序 代码 : 
sum=0 
OF ROOT 
SUI 一 SUm 十 又 


print (sum) 


如 果 要 计算 1 一 100 的 整数 之 和 ， 从 1 写 到 100 有 点 困难 。Python 提供 了 range() 内 置 
郧 数 ， 可 以 生成 一 个 整数 序列 ， 册 通过 list0 〇 函数 转换 成 列表 。 

例如 ，range(0, 5) 或 range(5) 生 成 的 序列 是 从 0 开始 小 于 5 的 整数 ， 不 包括 5。 

>>> list (range (5)) 

De 


range(1, 101) 就 可 以 生成 1 一 100 的 整数 序列 ， 计 算 1 一 100 的 整数 之 和 如 下 。 

sum=0 

for x 1n rangelle 10L): 

sum=sum+x 

print (sum) 

3 ) continue 和 break 语句 

break 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 , 一 般 放 在 直选 择 结构 中 , 一 旦 break 
语句 被 执行 ， 将 使 整个 循环 提前 结束 。 

continue 语句 的 作用 是 终止 当前 循环 ， 并 忽略 continue 之 后 的 语句 ， 然 后 回 到 循环 的 
顶端 ， 提 前 进入 下 一 次 循环 。 

除非 break 语句 能 让 代码 更 简单 或 更 清晰 ， 人 否则 不 要 轻易 使 用 。 

[ 例 ]1-4 continue 和 break 用 法 示例 。 


#continue 和 break 用 法 
i=1 
while 1<10: 
i+ 二 1] 
LE 1$230< # 非 双 数 时 跳 过 输出 
continue 


print ti) # 输 出 双 数 2、4、6、8、10 


1=1 


while Ls # 循 环 条 件 为 1 必定 成 立 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


Drant(1) # 输 出 1 一 10 

i+ 二 1] 

i # 当 并 大 于 10 时 跳出 循环 
break 


在 Python 程序 开发 的 过 程 中 , 将 完成 条 一 特定 功能 并 经 党 使 用 的 代码 编写 成 函数 ， 放 
在 函数 库 ( 模 块 ) 中 供 大 家 选用 ， 在 需要 使 用 时 直接 调用 ， 这 就 是 程序 中 的 函数 。 开 友人 
员 要 善于 使 用 函数 ， 以 提高 编码 效率 ， 减 少 编写 程序 段 的 工作 量 。 


1.2.4 Python 函数 与 模块 


当 某 些 任务 (例如 求 一 个 数 的 阶乘 ) 需要 在 一 个 程序 中 的 不 同位 置 重 复 执行 时 ， 会 造 
成 代码 的 重复 率 高 ， 应 用 程序 代码 烦琐 。 解 决 这 个 问题 的 方法 就 是 使 用 函数 。 无 论 是 在 哪 
门 编程 语言 中 ， 函 数 〈 在 类 中 称 为 方法 ， 意 义 是 相同 的 ) 都 扮演 着 至 关 重 要 的 角色 。 模 块 
是 Python 的 代码 组 织 单元 ,， 它 将 图 数 、 类 和 数据 封装 起 来 以 便 重 用 ， 模 块 往往 对 应 Python 
程序 文件 ，Python 标准 库 和 第 三 方 提供 了 大 量 的 模块 。 
@ 本 数 的 定义 
在 Python 中 ， 了 函数 定 义 的 基本 形式 如 下 : 
def 函数 名 (函数 参数 ) : 
函数 体 
return 表达 式 或 者 值 
在 这 里 说 明 几 点 : 
(1) 在 Python 中 采用 def 关键 字 进 行 函 数 的 定义 ， 不 用 指定 返回 值 的 类 型 。 
(2) 图 数 参数 可 以 是 零 个 、 一 个 或 者 多 个 ， 同 样 ， 函 数 参数 也 不 用 指定 参数 类 型 ， 
为 在 Python 中 变量 都 是 弱 类 型 的 ，Python 会 自动 根据 值 来 维护 其 类 型 。 
(3) 在 Python 中 ， 函 数 定 义 中 的 缩 进 部 分 是 函数 体 。 
(4) 函数 的 返回 值 是 通过 函数 中 的 return 语句 获得 的 。retum 语句 是 可 选 的 ， 它 可 以 
在 函数 体内 的 任何 地 方 出 现 ， 表 示 函 数 调 用 执行 到 此 结束 ; 如 果 没 有 retur 语句 ， 会 目 动 
返回 None( 空 值 )， 如 果 有 return 语句 ， 但 是 retum 后 面 没 有 接 表达 式 或 者 值 ， 也 是 返回 
None 〈 和 衬 值 )。 
下 面 定义 3 个 函数 : 
def printHello() : # 打 印 'hello' 字 符 串 
print("hello") 


def printNum(): # 输 出 数字 0 一 9 
for 1 in range(0,10): 
ET 
return 
def add (a,b): # 实 现 两 个 数 的 和 
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return a+b 


从 秀 数 的 使 用 
在 定义 了 录 数 之 后 就 可 以 使 用 该 水 数 了 ， 但 是 在 Python 中 要 注意 一 个 问题 ， 就 是 在 
Python 中 不 允许 前 回 引 用 ， 即 在 函数 定义 之 前 不 允许 调用 该 函数 。 大 家 看 回放 : 
下 面 的 例子 就 明日 了 : 
print (add (1, 2)) 


def add(a,b) : 
return a+b 视频 讲解 


这 段 程序 运行 的 错误 提示 如 下 : 


Traceback (most recent call last): 


File "C:/Users/xm]j/4-1.py", line 1, in <module> 
print (add (1,2)) 


MameError am dd” 5 no defined 


从 报 的 错 可 以 知道 ， 名 字 为 add 的 函数 未 进行 定义 。 所 以 在 任何 时 候 调 用 某 个 函数 ， 
必须 确保 其 定义 在 调用 之 前 。 
[ 例 ]1-5 编写 函数 ， 计 算 形 如 a+aa+aaa+aaaa +…+ aaa…aaa 的 表达 式 的 值 ， 其 中 a 为 
小 于 10 的 自然 数 。 例 如 2+22+222+2222+22222 (此 时 n=5)，a、n 由 用 户 从 键盘 输入 。 
分 析 : 关键 是 计算 出 求 和 中 每 一 项 的 值 。 容 易 看 出 每 一 项 都 是 前 一 项 扩大 10 倍 后 加 a。 
程序 代码 : 
def suml(a, n): 
FESUlE E00 # 同 时 将 result、t 赋值 为 0， 这 种 形式 比较 简洁 
for 1 in range(n): 
t=t*1]0+a 
Ee 
return result 


# 用 户 输 入 两 个 数字 

= (np (A 
ni) 
print (sum(a, n)) 


程序 运行 结 末 : 


输入 a: 2v 
输入 n: 5 
24690 


全 闭 包 

在 Python 中 ， 闭 包 (closure) 指 函 数 的 嵌 套 。 用 户 可 以 在 函数 内 部 定 
义 一 个 散 套 函数 ， 将 散 套 函数 视 为 一 个 对 象 ， 所 以 可 以 将 艇 套 函 数 作为 定 
义 它 的 函数 的 返回 结果 。 

[ 例 ]1-6 使 用 闭 包 的 例子 。 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


deE Funce Tmtie 
def add (x, y): 


return x+y 


return add # 返 回 函 数 对 象 


Eee 
print lfadadtl e274) 


在 函数 func_ lib0 中 定义 了 一 个 嵌 套 函数 add(x, y)， 并 作为 函数 func_lib0 的 返回 值 。 
其 运行 结果 为 3。 
@ 国 数 的 递归 调用 
函数 在 执行 的 过 程 中 直接 或 间接 调用 上 日 己 本 号 ， 称 为 递归 调用 。Python 语言 允许 递归 
调用 。 
[ 例 j1-7 求 1~5 的 平方 和 。 
eees trys 
I # 递 归 调 用 结束 的 条 件 
return 1 


else: 
return (f (x—1) +x*x) # 调 用 £() 函数 本 身 
printtetsyy 


加 模块 

通过 模块 (module) 能 够 有 逻辑 地 组 织 Python 代码 段 ， 把 相关 的 代码 
分 配 到 一 个 模块 里 能 让 代码 更 好 用 、 更 易 懂 。 简 单 地 说 ， 模 块 就 是 一 个 保 
存 了 Python 代码 的 文件 。 在 模块 里 能 定义 函数 、 类 和 变量 。 

在 Python 中 ， 模 块 和 C 语言 中 的 头 文件 以 及 Java 中 的 包 很 类 似 ， 例 
如 在 Python 中 要 调用 sqrt0 函 数 ， 必 须 用 Import 关键 字 引 入 math 这 个 模块 。 

1) 导入 某 个 模块 

在 Python 中 用 关键 字 Import 来 导入 某 个 模块 ， 方 式 如 下 : 


import 模块 名 # 导 入 模块 

例如 要 引用 模块 math， 就 可 以 在 文件 最 开始 的 地 方 用 import math 来 导入 。 
在 调用 模块 中 的 函数 时 必须 这 样 调用 : 

模块 名 .函数 名 

例如 : 


import math # 导 入 math 模块 
print ("50 的 平方 根 : "，math.sqrt (50)) 


为 什么 必须 加 上 模块 名 这 样 调用 呢 ? 因 为 可 能 存在 这 样 一 种 情况 : 在 多 个 模块 中 含有 
相同 名 称 的 函数 ,此 时 如 果 只 是 通过 函数 名 来 调用 , 解释 句 无 法 知道 到 抵 要 调用 哪个 函数 。 
所 以 如 果 像 上 述 这 样 导入 模块 ， 调 用 函数 必须 加 上 模块 名 。 
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有 时 候 只 需要 用 到 模块 中 的 系 个 函数 ,此 时 只 要 引入 该 函数 即 可 ,通过 from 语句 实现 : 


from 模块 名 import 函数 名 1, 函数 名 2… 
通过 这 种 方式 引入 ， 在 调用 函数 时 只 能 给 出 函数 名 ， 不 能 给 出 模块 名 ， 但 是 当 两 个 模 


块 中 含有 相同 名 称 函 数 的 时 候 ， 后 面 一 次 引入 会 履 直 前 一 次 引入 。 


也 就 是 说 ， 假 如 模块 A 中 有 函数 fun0， 在 模块 B 中 也 有 函数 fun 中 ， 如 果 引 入 A 中 的 


funO 在 先 , B 中 的 fun0 在 后 ,那么 在 调用 fun0 函 数 的 时 候 会 去 执行 模块 B 中 的 fn0 函 数 。 


如 果 想 一 次 性 导入 math 中 的 所 有 东西 ， 还 可 以 通过 以 下 语句 实现 : 


from math import * 


这 是 一 种 简单 的 导入 模块 中 所 有 项 目的 方式 ， 然 而 不 建议 过 多 地 使 用 这 种 方式 。 
2) 定义 自己 的 模块 


在 Python 中 ， 每 个 Python 文件 都 可 以 作为 一 个 模块 ， 模 块 的 名 字 就 是 文件 的 名 字 。 
比如 有 这 样 一 个 文件 fbo.py， 在 fibo.py 中 定义 了 3 个 函数 add0、fibO0、finb20: 
#f1ibo.py 
# 斐 波 那 契 (Fibonacci) 数列 模块 
def fib (n) : # 定 义 到 n 的 斐 波 那 契 数列 

a, b=0, 1 

while b<n: 


print (b, end="' ') 
a, b=b, a+b 
ET 0 
def fib2 (n) : # 返 回 到 n 的 辈 波 那 契 数列 
result=[] 
a, b=0, 1 
while b<n: 
result .append (b) 
a, b=b, a+b 
return result 
def add(a,b): 


return a+b 
那么 在 其 他 文件 (例如 testpy) 中 就 可 以 如 下 使 用 : 


#test .py 
import fibo 


加 上 模块 名 称 来 调用 函数 : 


fibo.fib(1000) # 结 果 是 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 
fibo.fib2 (100) # 结 果 是 [1，1, 2, 3, 5, 8, 13, 21, 34, 55, 89] 
test.add (2, 3) # 结 果 是 5 

当然 ， 也 可 以 通过 from fibo import add, fib, fib2 来 引入 。 

直接 通过 函数 名 来 调用 函数 : 
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fib(500) # 结 果 是 1 1 2 3 5 8 13 21 34 55 89 144 233 377 


如 果 想 列举 fibo 模块 中 定义 的 属性 ， 代 码 如 下 : 
import fibo 


dir (fibo) # 得 到 自 定义 模块 fibo 中 定义 的 变量 和 函数 
输出 结果 : 
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1.3 Python 面向 对 象 设计 


面 问 对象 程 序 设计 (Object Oriented Programming，OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ， 使 得 软件 设计 更 加 灵活 ， 能 够 很 好 地 文 持 代码 复 用 和 设计 复 用 ， 并 且 使 得 代码 
具有 更 好 的 可 读 性 和 可 扩展 性 。 

现实 生活 中 的 每 一 个 相对 独立 的 事物 都 可 以 看 作 一 个 对 象 ， 例 如 一 个 人 、 一 辆 车 、 一 
台 计 算 机 等 。 对 象 是 具有 茶 些 特性 和 功能 的 具体 事物 的 抽象 。 每 个 对 象 都 具有 描述 其 特征 
的 属性 及 附属 于 它 的 行为 。 例 如 ， 一 辆 车 有 凑 色 、 车 轮 数 、 座 椅 数 等 属性 ， 也 有 局 动 、 行 
驶 、 停 止 等 行为 ; 一 个 人 由 姓名 、 性 别 、 年 龄 、 喘 高 、 体 重 等 特征 摘 述 ， 也 有 走路 、 说 话 、 
学 习 、 开 芋 等 行为 ;一 台 计 算 机 由 主机 、 显 示 器 、 键 盘 、 鼠 标 等 部 件 组 成 。 

在 人 们 生产 一 台 计 算 机 的 时 候 ， 并 不 是 先生 产 主机 再 生产 显示 器 由 生产 键盘 和 鼠标 ， 
即 不 是 顺序 执行 的 ， 而 是 分 别 生产 设计 主机 、 显 示 器 、 键 盘 、 鼠 标 等 ， 最 后 把 它们 组 装 起 
来 。 这 些 部 件 通 过 事先 设计 好 的 接口 连接 ， 以 便 协 调 地 工作 。 这 就 是 面 回 对 象 程序 设计 的 
基本 思路 。 

每 个 对 象 都 有 一 个 类 型 ， 类 是 创建 对 象 实例 的 模板 ， 是 对 对 象 的 抽象 和 概括 ， 它 包含 
对 所 创建 对 象 的 属性 描述 和 行为 特征 的 定义 。 例 如 , 马路 上 的 汽车 是 一 个 一 个 的 汽车 对 象 ， 
它们 归属 于 一 个 汽车 类 ， 那 么 车 喘 闫 色 就 是 该 类 的 属性 ， 开 动 是 它 的 方法 ， 该 保养 了 或 者 
该 报废 了 丈 是 它 的 事件 。 

Python 完全 采用 了 面 回 对 象 程序 设计 的 思想 ， 是 真正 面 回 对 象 的 高 级 动态 编程 语言 ， 
完全 文 持 面 同 对象 的 基本 功能 ， 例 如 封装 、 继 承 、 多 态 以 及 对 基 类 方法 的 才 辣 或 重 写 。 与 
其 他 面向 对 象 程序 设计 语言 不 同 的 是 ，Python 中 对 象 的 概念 很 广泛 ，Python 中 的 一 切 内 容 
都 可 以 称 为 对 象 。 例 如 ， 字 符 串 、 列 表 、 字 典 、 元 组 等 内 置 数据 类 型 都 具有 和 类 完全 相似 
的 语法 和 用 法 。 


1.3.1 定义 和 使 用 类 


@ 类 的 定义 SE 
在 创建 类 时 用 变量 形式 表示 的 对 象 属性 称 为 数据 成 员 或 属性 (成 员 变 。 ”人 饮 虎 讲解 
量 )， 用 函数 形式 表示 的 对 象 行为 称 为 成 员 函 数 〈 成 员 方 法 )， 成 员 属 性 和 成 员 方 法 统称 为 


类 的 成 员 。 
类 定义 的 最 简单 的 形式 如 下 : 
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class 类 名 : 
属性 (成 员 变 量 ) 
属性 
成 员 函 数 ( 成 员 方 法 ) 
例如 定义 一 个 Person 人 员 类 : 


class Person : 


num=1 # 成 员 变量 (属性 ) 
def SayHello (self): # 成 员 函 数 
Brint("Hello mys 

这 里 在 Person 类 中 定义 了 一 个 成 员 函 数 SayHello(sel 们 ， 用 于 输出 字符 串 "Hello!"。 同 
Python 使 用 缩 进 标识 类 的 定义 代码 。 
@ 对 象 的 创建 
对 象 是 类 的 实例 。 如 果 人 类 是 一 个 类 ， 那 么 某 个 具体 的 人 就 是 一 个 对 象 。 只 有 定义 了 
具体 的 对 象 ， 才 能 通过 “对 象 名 .成 员 ” 的 方式 来 访问 其 中 的 数据 成 员 或 成 员 方法 。 

Python 创建 对 象 的 语法 如 下 : 

对 象 名 = 类 名 () 

例如 ， 下 面 的 代码 定义 了 一 个 Person 类 的 对 象 p: 


P= Persend) 
p.SayHello() # 访 问 成 员 函 数 SayHello () 


运行 结 示 如 下 : 


Hello! 


1.3.2 ”构造 函数 


类 可 以 定义 一 个 特殊 的 称 为 ”init _0 的 方法 (构造 函数 ， 以 两 个 下 夯 线 “ ”开头 
和 结束 )。 在 一 个 类 定义 了 __init 0 方法 以 后 ， 类 实例 化 时 就 会 自动 为 新 生成 的 类 实例 调 
用 __init _0 方 法 ,构造 函数 一 般 用 于 完成 对 象 数 据 成 员 设 置 初 值 或 进行 其 他 必要 的 初始 化 工 
作 。 如 果 用 户 未 涉及 构造 函数 ，Python 将 提供 一 个 默认 的 构造 函数 。 

例如 定义 一 个 复数 类 Complex， 构 造 函 数 完成 对 象 变量 的 初始 化 工作 。 


class Complex: 


样 


- 


def init (self, realpart, imagpart): 
self .r=realpart 
self.1=ijmagpart 
x=Complex (3.0,—4.95) 


ET re 


运行 结果 如 下 : 
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号 本 


1.3.3 ” 析 构 函数 


Python 中 类 的 析 构 函数 是 del ()， 用 来 释放 对 象 占用 的 资源 ， 在 Python 收回 对 象 
空间 之 前 上 自动 执行 。 如 果 用 户 未 涉及 析 构 函数 ，Python 将 提供 一 个 默认 的 析 构 函数 进行 必 
要 的 清理 工作 。 

例如 : 


class Complex: 
def init (self, realpart, imagpart): 
self .r=realpart 
self.1=imagpart 
def del (self): 
print ("Complex 不 存在 了 ") 
x=Complex(3.0,—4.95) 


Brantix ror 


Drinttlx) 

del x # 删 除 对 象 变量 x 
运行 结果 如 下 : 

上 

< main .Complex object at 0X01F87C90> 
Complex 不 存在 了 


说 明 : 在 删除 对 象 变量 x 之 前 , x 是 存在 的 , 在 内 存 中 的 标识 为 0x01F87C90, 执行 “del 
x” 语 句 后 , 对 象 变量 x 不 存在 了 ， 系 统 自动 调用 析 构 函数 ， 所 以 出 现 “Complex 不 存在 了 ” 
的 情况 。 


1.3.4 实例 属性 和 类 属性 


属性 (成 员 变 量 ) 有 两 种 ， 一 种 是 实例 属性 ， 另 一 种 是 类 属性 〈 类 变量 )。 实 例 属 性 
是 在 构造 函数 。、_init _()〔( 以 两 个 下 男 线 “ _ ”开头 和 结束 ) 中 定义 的 ， 定 义 时 以 self 作 
为 前 级 ; 类 属性 是 在 类 中 方法 之 外 定义 的 属性 。 在 主 程序 中 (在 类 的 外 部 )， 实 例 属 性 属于 
实例 (对 象 )。 只 能 通过 对 象 名 访问 ; 类 属性 属于 类 ， 可 以 通过 类 名 访问 ， 也 可 以 通过 对 象 
名 访问 ， 为 类 的 所 有 实例 共 至 。 

[ 例 ]1-8 定义 含有 实例 属性 (姓名 name、 年 龄 age) 和 类 属性 (人数 num) 的 Person 
(人 员 ) 类 。 


class Person : 


num=1 # 类 属性 
deF re iE UISoLt En # 构 造 函 数 
self .name=str # 实 例 属性 
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self .age=n 


def SayHello (self): # 成 员 函 数 
print ("Hello!™") 
def PrintName (self): # 成 员 函 数 
printt" 寻 名 "Self nane "人 秆 本 3 "self 3ge) 
def PrintNum(self) : # 成 员 函 数 
print (Person.num) # 由 于 是 类 属性 ， 所 以 不 写 self .num 
# 主 程序 


Pl=Person (" 夏 敏捷 "，, 42) 

P2=Person (" 王 琳 ", 36) 

Pl .PrintName () 

P2 .PrintName () 

Person .num=2 # 修 改 类 属性 
P1 .PrIntNum() 

P2 .PrIntNum() 


运行 结果 如 下 : 


姓名 :” 夏 敏捷 年 龄 : 42 
姓名 :” 王 琳 年 龄 : 36 
到 
区 


num 变量 是 一 个 类 变量 ， 它 的 值 将 在 这 个 类 的 所 有 实例 之 间 共 享 。 用 户 可 以 在 类 内 部 
或 类 外 部 使 用 Person. num 访问 。 

在 类 的 成 员 函 数 〈 方 法 ) 中 可 以 调用 类 的 其 他 成 员 函 数 (方法 )， 可 以 访问 类 属性 、 
对 象 实例 属性 。 

在 Python 中 比较 特殊 的 是 ,可 以 动态 地 为 类 和 对 象 增加 成 员 ， 这 一 点 是 和 很 多 面 癌 对 
象 程 序 设计 语言 不 同 的 ， 也 是 Python 动态 类 型 特点 的 一 种 重要 体现 。 


1.3.5 ”私有 成 员 与 公有 成 员 


Python 并 没有 对 私有 成 员 提 供 严 格 的 访问 保护 机 制 。 在 定义 类 的 属性 时 ， 如 果 属 性 名 
以 两 个 下 男 线 “ ”开头 ， 表 示 是 私有 属性 ， 人 否则 是 公有 属性 。 私 有 属性 在 类 的 外 部 不 能 
直接 访问 ， 需 要 通过 调用 对 象 的 公有 成 员 方 法 来 访问 ， 或 者 通过 Python 文 持 的 特殊 方式 来 
访问 。Python 提供 了 访问 私有 属性 的 特殊 方式 ， 可 用 于 程序 的 测试 和 调试 ， 对 于 成 员 方 法 
也 具有 同样 的 性 质 。 这 种 方式 如 下 : 

对 象 名 .。_ 类 名 + 私有 成 员 

例如 访问 Car 类 私有 成 员 _weight: 

carl. Car _WelLght 

私有 属性 是 为 了 数据 封装 和 保密 而 设 的 属性 ， 一 般 只 能 在 类 的 成 员 方 法 (类 的 内 部 ) 
中 使 用 访问 , 虽然 Python 文 持 一 种 特殊 的 方式 从 外 部 直接 访问 类 的 私有 成 员 , 但 是 并 不 推 
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荐 大 家 这 样 做 。 公 有 属性 是 可 以 公开 使 用 的 ， 既 可 以 在 类 的 内 部 进行 访问 ， 也 可 以 在 外 部 
程序 中 使 用 。 
[ 例 ]1-9 为 Car 类 定义 私有 成 员 。 


class Car: 


price=100000 # 定 义 类 属性 
def init (self, c, w): 
self.color=c # 定 义 公 有 属性 color 
self. weight=w # 定 义 私 有 属性 ”weight 
# 主 程序 


carl=Car ("Red",10 .95) 
car2=Car("Blue",11.8) 


Brintlcarl color) 


printicarl eq Car werght) 

print (carl. weight) #AttributeError 

运行 结果 如 下 : 

Red 

1 

AttributeError: 'Car' object has no attribute ' weight' 


1.3.6 万 法 


在 类 中 定义 的 方法 可 以 粗略 地 分 为 3 大 类 ， 即 公有 方法 、 私 有 方法 、 静 态 方法 。 其 中 ， 
公有 方法 、 私 有 方法 都 属于 对 象 ， 私 有 方法 的 名 字 以 两 个 下 夯 线 “ ”开始 ， 每 个 对 象 都 
有 目 己 的 公有 方法 和 私有 方法 ， 在 这 两 类 方法 中 可 以 访问 属于 类 和 对 象 的 成 员 ; 公有 方法 
通过 对 象 名 直接 调用 ， 私 有 方法 不 能 通过 对 象 名 直接 调用 ， 只 能 在 属于 对 象 的 方法 中 通过 
self 调用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调用 。 如 果 通 过 类 名 来 调用 属于 对 象 的 公 
有 方法 ， 需 要 显 式 地 为 该 方法 的 self 参数 传递 一 个 对 象 名 ， 用 来 明确 指定 访问 哪个 对 象 的 
数据 成 员 。 静 态 方法 可 以 通过 类 名 和 对 象 名 调用 ， 但 不 能 直接 访问 属于 对 象 的 成 员 ， 只 能 
访问 属于 类 的 成 员 。 

[ 例 ]1-10 公有 方法 、 私 有 方法 、 静 态 方法 的 定义 和 调用 。 


1 


price=0 

def init ‘(selfy: 
self. color="'Red" # 定 义 和 设 置 私 有 属性 color 
self. city='Kunming' # 定 义 和 设 置 私 有 属性 city 

Qef “outpautColor(self): # 定 义 私 有 方法 outputColor () 
Brioliiself Color) # 访 问 私 有 属性 color 

deE OUDotCiLvlSelrEy: # 定 义 私有 方法 outputCity 1() 

print(self. city) # 访 问 私有 属性 city 

def output (self): # 定 义 公 有 方法 output () 

selfJ oUtpPputColord) # 调 用 私有 方法 outputCoLlord) 


第 1 章 Python 基础 知识 


self. outputCcity() # 调 用 私有 方法 outputCity () 
@ staticmethod 
def getPricel(): # 定 义 静 态 方 法 getPrice () 


return Fruit.price 
@ staticmethod 
def setPrice (p): # 定 义 静 态 方 法 setPrice () 
Fruit .price=p 
# 主 程序 
apple=Fruit () 
apple .output () 
print (Fruit .getPrice()) 
Fruits setPrice(s) 


print (Fruit .getPrice ()) 
运行 结果 如 下 : 


Red 
Kunming 
0 

9 


继承 是 为 代码 复 用 和 设计 复 用 而 设计 的 ， 是 面 回 对 象 程序 设计 的 重要 特性 之 一 。 在 设 
计 一 个 新 类 时 ， 如 果 可 以 继承 一 个 已 有 的 设计 民 好 的 类 ， 然 后 进行 二 次 开发 ， 无 疑 会 大 幅 
度 减少 开发 的 工作 量 。 


1.3.7 类 的 继承 


在 继承 关系 中 ， 已 有 的 、 设 计 好 的 类 称 为 父 类 或 基 类 ， 新 设计 的 类 称 
为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ， 但 是 不 能 继承 其 私有 
成 员 。 = 如 
类 继承 的 语法 格式 如 下 : 视频 讲解 
class 派生 类 名 ( 基 类 名 ) : # 基 类 名 写 在 括号 里 

派生 类 成 员 


在 Python 中 继承 有 以 下 特点 : 

(1) 在 继承 中 基 类 的 构造 函数 〈(__init _0 方 法 ) 不 会 被 目 动 调用 ， 它 需要 在 其 派生 
类 的 构造 中 专门 调用 。 

(2) 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ， 通 过 “ 基 类 名 .方法 名 0” 的 方式 来 实现 ， 
需要 加 上 基 类 的 类 名 前 级 ， 且 需要 市 上 self 参数 变量 (在 类 中 调用 普通 函数 时 并 不 需要 市 
上 self 参数 )， 也 可 以 使 用 内 置 疯 数 superO 实 现 这 一 目的 。 

(3) Python 总 是 先 查 找 对 应 类 型 的 方法 ， 如 果 不 能 在 派生 类 中 找到 对 应 的 方法 ， 它 才 
开始 到 基 类 中 逐个 查找 ( 先 在 本 类 中 查找 调用 的 方法 ， 找 不 到 才 去 基 类 中 找 )。 

[ 例 ]1-11 设计 Person 类 ,并 根据 Person 派生 Student 类 ,分 别 创 建 Person 类 与 Student 
类 的 对 象 。 
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# 定 义 基 类 : Person 类 
import types 
class Person (object) :# 基 类 必须 继承 于 object， 否 则 在 派生 类 中 将 无 法 使 用 super () 函数 
def init (self, name='', age=20, sex='man'): 
self.setName (name) 
self .setAge (age) 
self.setSex (sex) 


def setName (self, name): 


i type lname) =9tr: # 内 置 函数 type () 返回 被 测 对 象 的 数据 类 型 
print (' 姓 名 必须 是 字符 串 .') 
return 


self. name=name 
def setAge(self, age): 
if type (age) !=int: 
print (' 年 龄 必须 是 整 型 .') 
return 
self. age=age 
def setSex(self, sex): 
eril "nd senl rd 
print (' 性 别 输入 错误 ') 
return 
self. sex=sex 
def show(self): 
print (' 姓 名 : '，self. name，' 年 龄 ，'，self. age ,' 性 别 : '，self. _sex) 
# 定 义 子 类 (student 类 )， 在 其 中 增加 一 个 入 学 年 份 私 有 属性 (数据 成 员 ) 
class Student (Person): 
def init (self, name='', age=20, sex='man', schoolyear=2016): 


# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 


super(sStudent, self). init (name, age, sex) 
#Person. init (self，name，age，sex)# 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
self.setSchoolyear (schoolyear) # 初 始 化 派生 类 的 数据 成 员 


def setSchoolyear(self, SchoolLyear) : 
self. schoolyear=schoolyear 
def show(self): 


Person.show (self) # 调 用 基 类 的 show () 方 法 
#super (Student, self) .show() # 也 可 以 这 样 调 用 基 类 的 show () 方法 
EnET 大 字 年 从 SeTESOSCEOOTYeaT) 

# 主 程序 

if name ==' main _'": 


zHangsan person(t' 引 S197 二 和“ 
zhangsan .show () 

1isi=Student (' 李 四 '，18，' 男 '，2015) 
1isi.show() 


lisi.setAge (20) # 调 用 继承 的 方法 修改 年 龄 


lai Showml} 
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运行 结果 如 下 : 
姓名 :” 张 三 年 龄 : 19 性 别 : 男 
姓名 :” 李 四 年 龄 : 18 性 别 : 男 
入 学 年 份 : 2015 
姓名 :” 李 四 年 龄 : 20 性 别 : 男 
入 学 年 份 : 2015 


方法 重 写 必须 出 现在 继承 中 。 它 是 指 在 派生 类 继承 了 基 类 的 方法 之 后 ， 如 果 基 类 方法 
的 功能 不 能 满足 需求 ， 需 要 对 基 类 中 的 某 些 方法 进行 修改 。 用 户 可 以 在 派生 类 中 重 写 基 类 
的 方法 ， 这 就 是 重 写 。 

[ 例 ]1-12 重 写 父 类 ( 基 类 ) 的 方法 。 

class Animal: # 定 义 父 类 


def run(self): 
print (Animal is running...)  # 调 用 父 类 方法 


class Cat (Animal) : # 定 义 子 类 
def run(selfy: 

printicat 13 TUnNNning2e.) # 调 用 子 类 方法 
class Dog (Animal): # 定 义 子 类 

def run(self): 

Brint(nog 75 ronning ey # 调 用 子 类 方法 
c=Dog () # 子 类 实例 
Coruml) # 子 类 调用 重 写 方法 
程序 运行 结果 : 


Dodq is ranninge 


当 子 类 Dog 和 父 类 Animal 存在 相同 的 run0 方 法 时 ， 子 类 的 ran0 覆 盖 了 父 类 的 run0)， 
在 代码 运行 时 总 是 会 调用 子 类 的 mn0， 这 样 就 获得 了 继承 的 另 一 个 优点 一 一 多 态 。 


1.3.8 多 态 本 


br 


要 理解 什么 是 多 态 , 首先 要 对 数据 类 型 再 做 一 点 说 明 : 在 定义 一 个 class 和 
的 时 候 ， 实 际 上 就 定义 了 一 种 数据 类 型 。 通 常 ， 定 义 的 数据 类 型 和 Python 视频 讲解 
自 带 的 数据 类 型 (例如 string、list、dict) 没什么 区 别 。 


a=113t (0) #a 是 1ist 类 型 
b=Animal () #b 是 Animal 类 型 
c=Dog () #c 是 Dog 类 型 


一 个 变量 是 否 为 某 个 类 型 可 以 用 isinstance() 判 断 : 


>>> isinstance (a, list) 


True 
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>>> lisinstance (b, Animal) 
True 
>>> lsinstance(c, Dog) 


True 
a、b、c 确实 对 应 list、Animal、Doeg 这 3 种 类 型 。 


>>> isinstance(c, Animal) 


True 

因为 Dog 是 从 Animal 继承 的 ， 当 创建 了 一 个 Dog 的 实例 c 时 ， 认 为 c 的 数据 类 型 是 
Dog 没 错 ， 但 c 同时 也 是 Animal，Dosg 本 来 就 是 Animal 的 一 种 。 

所 以 ， 在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 么 它 的 数据 类 型 也 可 
以 被 看 作 是 父 类 。 但 是 ， 反 过 来 就 不 可 以 : 

>>> b=Animal () 


>>> isinstance (b, Dog) 
False 


Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 
要 理解 多 态 的 好 处 ， 还 需要 再 编写 一 个 图 数 ， 这 个 函数 接受 一 个 Animal 类 型 的 变量 : 
def TonEwaecetanamoiya 


animal run()} 


= 


当 传 入 Animal 的 实例 时 ，run_twice() 就 打印 出 : 


>>> run twice (Animal ()) 
Animal is running... 
Animal is running... 


当 传 入 Dog 的 实例 时 ，run_ twice0 就 打印 出 : 


>>> run twice(Dog() ) 
Dog 了 SETannlng <. 
Dog sn roanrlng 


当 传 入 Cat 的 实例 时 ，run_twice0 就 打印 出 : 


>>> run twice (Cat()) 
cat Ts3 TOnNning 二 
Cal 15 TUNNIng < 


现在 ， 如 果 再 定义 一 个 Tortolse 类 型 ， 也 从 Animal 派生 : 


lassTrToOFEGISeTADDDS = 
def run(self): 
print( "Tortolse 19 /TONnning Slowly ee ") 


当 调 用 run twiceO 时 传 入 Tortoise 的 实例 : 


>>> run twlce (Tortolse () ) 
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Tortoise 15 Tunning slowly... 


Tortolse is running slowly... 


大 家 会 发 现 新 增 了 一 个 Animal 的 子 类 ,不必 对 rmn_twice0 做 任何 修改 。 实 际 上 , 任何 
依赖 Animal 作为 参数 的 函数 或 者 方法 都 可 以 不 加 修改 地 正常 运行 ， 原 因 就 在 于 多 态 。 

多 态 的 好 处 就 是 ， 当 需要 传 入 Dog、Cat、Tortoise 等 时 ， 只 需要 接收 Animal 类 型 就 可 
以 了 ， 因 为 Dog、Cat、Tortoise 等 都 是 Animal 类 型 ， 然 后 按照 Animal 类 型 进行 操作 。 由 
于 Animal 类 型 有 run0 方 法 ， 因 此 传 入 的 任意 类 型 ， 只 要 是 Animal 类 或 者 子 类 ， 就 会 自动 
调用 实际 类 型 的 mn0 方 法 ， 这 就 是 多 态 的 意思 。 

对 于 一 个 变量 ， 用 户 只 需要 知道 它 是 Animal 类 型 ， 无 须 确切 地 知道 它 的 子 类 型 ， 就 
可 以 放心 地 调用 rmn0 方 法 ,而 具体 调用 的 rmmn0 方 法 是 作用 在 Animal、Dog、Cat 还 是 Tortoise 
对 象 上 ， 由 运行 时 该 对 象 的 确切 类 型 决定 ， 这 就 是 多 态 真 正 的 威力 : 调用 方 只 管 调用 ， 不 
管 细节 ， 而 当 新 增 一 种 Animal 的 子 类 时 ， 只 要 确保 run() 方 法 编写 正确 ， 不 用 管 原来 的 代 
码 是 如 何 调用 的 。 这 就 是 著名 的 “ 开 财 ”原则 ， 包 括 以 下 两 点 。 

(1) 对 扩展 开放 : 人 允许 新 增 Animal 子 类 。 

(2) 对 修改 封闭 : 不 需要 修改 依赖 Animal 类 型 的 run_twice(0) 等 函数 。 


1.3.9 ”面向 对 象 应 用 案例 一 一 扑克 上牌 发 牌 程序 


【 案例 】 采 用 扑克 牌 类 设计 扑 死 牌 发 牌 程序 。 
4 名 牌 手打 牌 ， 计 算 机 随机 将 52 张 牌 (不 含 大 /小 鬼 ) 发 给 4 名 牌 手 ， 并 在 屏幕 上 显 
示 每 位 牌 手 的 牌 。 程 序 的 运行 效果 如 图 1-5 所 示 。 


[5 *python 3.5.0 Shel: = 
File Edit Shell Debug Options Window Help 


Python 3.5.0 bs. 5, D0: 374t001t4561, Sep 13 2015, 02:27:37) eh v.1900 Bd bit CAMD84)] on win32 
De “copyright “credits” or “licensel)” for more informati 


7 红 9 
8 起 
IT10 本 
红 J 站 


图 1-5 扑克 有 牌 发 牌 程序 的 运行 效果 


发 牌 程序 设计 出 3 个 类 一 一 Card 类 、Hand 类 和 Poke 类 。 

@@ Card 类 

Card 类 代表 一 张 牌 , 其 中 FaceNum 字段 指 的 是 牌 面 数字 1 一 13, Suit 字段 指 的 是 花色 ， 
值 “ 梅 ”为 梅花 、“ 方 ”为 方 钼 、“ 红 ”为 红心 、“ 黑 ”为 黑 桃 。 

(1) Card 构造 函数 根据 参数 初始 化 封装 的 成 员 变 量 ， 实 现 牌 面 大 小 和 花色 的 初始 化 ， 
以 及 是 否 显示 牌 面 ， 默 认 True 为 显示 牌 的 正面 。 

(2) __str _ (方法 用 来 输出 牌 面 大 小 和 花色 。 

(3) pic_order(0) 方 法 获取 牌 的 顺序 号 ， 牌 面 按 梅 伦 1 一 13 一 方块 14 一 26 一 红 桃 27 一 
39 一 黑 桃 40 一 52 的 顺序 编号 〈 未 洗 牌 之 前 )。 也 就 是 说 ， 梅 花 2 的 顺序 号 为 2， 方 块 A 的 
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顺序 号 为 14， 方 块 KK 的 顺序 号 为 26。 这 个 方法 是 为 图 形 化 显示 有 牌 面 预 留 的 方法 。 


(4) flip0 是 翻 牌 方法 ， 改 变 牌 面 是 否 显 示 的 属性 值 。 


#Cards 


Module 


class Card(): 


olavan cand Cn 


RANKS=["A", Te ppt he i ee i 2 


def 


def 


def pic order (self): 


a i i es be Ce a 


init (self, rank, suit, face up=True): 
self.rank=rank # 指 的 是 牌 面 数字 1 一 13 
self.suit=suit # 指 的 是 花色 


self.is face up=face up # 是 否 显 示 牌 的 正面 ，True 为 正面 False 为 背面 


if self.1s face up: 
rep=self.suit+self.rank 
else: 
rep="XX" 


return rep 


# 牌 的 顺序 号 


if self.rank=="A": 
FaceNum=1 

elif self.rank=="J": 
FaceNum=11 

elif self.rank=="Q": 
FaceNum=12 

elif self.rank=="K": 
FaceNum=13 

else: 
FaceNum=nt {self. rank) 

if Self .suit==" 梅 ": 
Suit=1 

elif self.suit==" 万 ": 
Suit=2 

elif self.suit==" 红 ": 
Suit=3 

else: 
Suit=4 

return (Sult-1)*13+FaceNum 


def flip(self) : # 翻 牌 方法 
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self.is face up=not self.1s face up 


# 牌 面 数 字 1 一 13 
SUITS= [" 梅 "， mn 方 "， " 红 "™ " 黑 "] #" 梅 "为 梅花 ， " 方 "为 方 钻 ， " 红 m 为 红心 ， 


_str _ (self) : # 重 写 print () 方法， 打印 一 张 牌 的 信息 
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从 Hand 类 
Hand 类 代表 一 手 牌 (一 个 玩家 手 里 拿 的 牌 ), 可 以 认为 是 一 位 牌 手 手 里 的 牌 , 其 中 cards 
列表 变量 存储 牌 手 手 里 的 牌 。 玩 家 可 以 增加 牌 、 清 空手 里 的 牌 、 把 一 张 牌 给 其 他 牌 手 。 


class Hand(): 
Sm en Na or Laving cardss 
def init (self): 
self .cards=[] #cards 列表 变量 存储 牌 手 的 牌 
derf eo str Jlselfl: # 重 写 print () 方 法 ， 打 印 出 牌 手 的 所 有 牌 
if self.cards: 
rep="™" 
for card in self.cards: 
rep+=str (card)+"\t" 
else: 
rep=" 无 牌 " 
return rep 
def clear(self): # 清 空手 里 的 牌 
self.cards=[|] 
def add(self, card): # 增 加 牌 
self .cards .append (Card) 
def give(self，card，other hand) : “ # 把 一 张 牌 给 其 他 牌 手 
self.cards.remove (card) 
other hand.add (card) 


全 Poke 类 
Poke 类 代表 一 副 牌 , 可 以 看 作 是 有 52 张 牌 的 牌 手 , 所 以 继承 Hand 类 。 由 于 其 中 cards 
列表 变量 要 存储 52 张 牌 ， 而 且 要 友 牌 、 洗 牌 ， 所 以 增加 如 下 方法 : 
(1) populate(self) 生 成 存储 了 52 张 牌 的 一 手 牌 ， 当 然 这 些 牌 是 按 梅花 1 一 13 一 方块 
14 一 26 一 红 桃 27 一 39 一 黑 桃 40 一 52 的 顺序 〈 未 洗 牌 之 前 ) 存储 在 cards 列表 变量 中 。 
(2) shuffle(selb 洗 牌 ， 使 用 Python 的 random 模块 的 shuffleO0 方 法 打 乱 牌 的 存储 顺序 
即 可 。 
(3) deal(self hands，per hand=13) 是 完成 发 牌 动作 ， 发 给 4 个 玩家 ， 每 人 默认 13 张 
牌 。 当 然 ， 如 果 给 per hand 传 10， 则 每 人 发 10 张 牌 ， 只 不 过 牌 没 有 友 完 而 已。 
#Poke 类 
class Poke (Hand): 
erk oF old eardo sm 
def populate (self): # 生 成 一 副 牌 
For sult 1m Card SUTTS: 


For radk in Card RARANRKS > 
self.add (Card (rank, suit)) 


def shuffle (self): # 洗 牌 
import random 
random.shuffle (self .cards) # 打 乱 牌 的 顺序 
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def deall(self, hands, per hand=13): # 发 牌 ， 发 给 玩家 ， 每 人 默认 13 张 牌 
for rounds in range (per hand) : 
for hand in hands: 

1f self Cards: 
Cop card self ecardslnl 
self .cards .remove (top card) 
hand.add (top card) 
#self.give (top card，hand) # 上 两 句 可 以 用 此 语句 替换 

else: 


print ("不 能 继续 发 牌 了 ， 有 牌 已 经 发 完 !") 


@ 主 程序 
主 程序 比较 简单 ， 因 为 有 4 个 玩家 ， 所 以 生成 players 列表 存储 初始 化 的 4 位 牌 手 。 生 
成 一 副 牌 对 象 实例 poke1， 调 用 populate() 方 法 生成 有 52 张 牌 的 一 副 牌 ， 调 用 shuffle() 方 法 
洗 牌 打 乱 顺序 ， 调 用 dealplayers,13) 方 法 有 友 给 玩家 每 人 13 张 牌 ， 最 后 显示 4 位 牌 手 所 有 
的 牌 。 
# 主 程序 
if name ==" main _": 
print ("This is a module with classes for playing cards.") 
#4 个 玩家 
players=[Hand(), Hand() ,Hand () ,Hand ()] 
pokel=Poke () 


pokel .populate () # 生 成 一 副 牌 
pokel.shuffle () # 洗 有 牌 

pokel .deal (players, 13) # 发 给 玩家 每 人 13 张 牌 
# 显 示 4 位 牌 手 的 牌 

i 


for hand in players: 
print (" 牌 手 ", n,end=":") 
print (hand) 
n=n+1 


input ("\nPress the enter key to exit.") 


1.4 Python 图 形 界面 设计 


Python 提供 了 多 个 图 形 开发 界面 的 库 ， 几 个 常用 的 Python GUI 库 如 下 。 

(1) Tkinter: Tkinter 模块 (Tk 接口 ) 是 Python 的 标准 Tk GUI 工具 包 的 接口 。Tkinter 
可 以 在 大 多 数 Unix 平台 下 使 用 ， 同 样 可 以 应 用 在 Windows 和 Macintosh 系统 里 。Tk8.0 的 
后 续 版 本 可 以 实现 本 地 窗口 风格 ， 并 民 好 地 运行 在 绝 大 多 数 平 台中 。 

(2) wxPython: wxPython 是 一 球 开 源 软 件 ， 是 Python 语言 的 一 套 优 秀 的 GUI 图形 库 ， 
允许 Python 程序 员 很 方便 地 创建 完整 的 、 功 能 键 全 的 GUI 用 户 界 面 。 
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(3) Jython: Jython 程序 可 以 和 Java 无 颖 集成 。 除 了 一 些 标 准 模 块 以 外 ，Jython 使 用 
Java 的 模块 。Jython 几乎 拥有 标准 的 Python 中 不 依赖 于 C 语言 的 全 部 模块 。 例 如 ，Jython 
的 用 户 界面 使 用 Swing、AWT 或 者 SWT。Jython 可 以 被 动态 或 静态 地 编译 成 Java 机 

Tkinter 是 Python 的 标准 GUI 库 。 由 于 Tkinter 是 内 置 到 Python 的 安装 包 中 ， 只 要 
装 好 Python， 之 后 就 能 Import Tkinter 库 ， 而 且 IDLE 也 是 用 Tkinter 编写 而 成 ， 对 于 简单 
的 图 形 界 面 ，Tkinter 还 是 能 应 付 和 目 如 的 ， 使 用 Tkinter 可 以 快速 地 创建 GUI 应 用 本 
书 主要 使 用 Tkinter 设计 图 形 界面 。 


1.4.1 创建 Windows 窗口 


[ 例 ]1-13 使 用 Tkinter 创建 一 个 Windows 窗口 的 GUI 程序 。 视频 讲解 
import tkinter # 导 入 Tkinter 模块 

win=tkinter.TKk () # 创 建 Windows 窗口 对 象 

win.title(' 我 的 第 一 个 GUI 程序 ') # 设 置 窗口 标题 

win.mainloop () # 进 入 消息 循环 ， 也 就 是 显示 窗口 


以 上 代码 的 执行 结果 如 图 1-6 所 示 ， 可 见 Tkinter 可 以 很 
方便 地 创建 Windows 窗口 。 

在 创建 Windows 窗口 对 象 之 后 ， 可 以 使 用 geometry0 方 
法 设置 窗口 的 大 小 ， 格 式 如 下 : 


窗口 对 象 .geometry ("size") 


时 我 的 第 一 个 GUI] 但 序 


S1Ze 用 于 指定 窗口 大 小 ， 格式 如 下 : 图 1-6 ”Tkinter 创建 一 个 窗口 
宽度 x 高 度 ( 注 : x 是 小 写字 母 ， 不 是 乘 号 ) 
[ 例 ]1-14 显示 一 个 Windows 窗口 ， 初 始 大 小 为 800 X600。 


from tkinter import * 
wn 
win.geometry("800x600") 
win.mainloop (); 


另外 ， 还 可 以 使 用 minsize0 方 法 设置 窗口 的 最 小 尺寸 , 使 用 maxsize() 方 法 设置 窗口 的 
最 大 尺寸 ， 方 法 如 下 : 


窗口 对 象 . minsize ("最 小 宽度 x 最 小 高 度 ") 
窗口 对 象 . maxsize ("最 大 宽度 x 最 大 高 度 ") 


例如 : 


win. minsize ("400x600") 


win. maxsize ("1440x800") 


1.4.2 几何 布局 常理 居 
Tkinter 几何 布局 管理 器 (Geometry Manager) 用 于 组 织 和 管理 父 组 件 〈 往 往 是 窗口 
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中 子 组 件 的 布局 方式 。Tkinter 提供 了 3 种 不 同 风格 的 几何 布局 管理 类 , 即 pack、grid 和 place。 
@ pack 几何 布局 管理 器 
pack 几何 布局 管理 器 采用 块 的 方式 组 织 组 件 , pack 布局 根据 子 组 件 创 建生 成 的 顺序 将 
其 放 在 快速 生成 的 界面 中 。 
调用 子 组 件 的 方法 pack0， 则 该 子 组 件 在 其 父 组 件 中 采用 pack 布局 : 


pack (option=value, ...) 
pack() 方 法 提供 了 如 表 1-1 所 示 的 若干 参数 选项 。 


表 1-1 pack() 方 法 提供 的 参数 选项 
选项 取 值 范 


side 停靠 在 父 组 件 的 哪 一 边 上 top' (默认 值 )、'bottom'、'left'、'right' 
停靠 位 置 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | '、's'、'e'、'W'、'nW'、'sW'、'se'、'ne'、'center' 
anchor | 个 角 (默认 值 ) 
UT yo one 
expand 扩展 空间 0 或 1 
ipadx、 单位 为 c (厘米 )、m (毫米 )、i (英寸 )、p ( 打 


组 件 内 部 在 xy 方向 上 填充 的 空间 大 小 | 印 机 的 点 


单位 为 c (厘米 )、m 〈 军 米 )、1 (英寸 )、p( 打 
印 机 的 点 》 


[ 例 ]1-15 pack 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-7 所 示 。 


ipady 
padx、pady | 组 件 外 部 在 x/y 方 回 上 填充 的 空间 大 小 


import tkinter 
roode Ekinere RH 
label=tkinter.Label (root, text='hello,python') 
Tabel pack() # 将 Label 组 件 添加 到 窗口 中 显示 
buttonl=tkinter.Button (root, text='BUTTON]1') 

# 创 建文 字 是 “BUTTON1” 的 Button 组 件 
buttonl .pack (side=tkinter .LEFT) 

# 将 buttonl 组 件 添加 到 窗口 中 显示 ， 左 停靠 
button2=tkinter.Button (root, text='BUTTON2"') 

# 创 建文 字 是 “BUTTON2” 的 Button 组 件 
button2.pack (side=tkinter .RIGHT) 

# 将 button2 组 件 添加 到 窗口 中 显示 ， 右 停靠 


root .malnloop () 


@ grid 儿 何 布局 管理 器 
grid 几何 布局 管理 器 采用 表格 结构 组 织 组 件 。 子 组 件 的 hello ,Python 


位 置 由 行 / 列 确定 的 单元 格 决 定 ， 子 组 件 可 以 跨越 多 行 / 列 。 在 
每 一 列 中 ， 列 宽 由 这 一 列 中 最 宽 的 单元 格 确定 。grid 几何 布 
局 管理 器 适合 表现 表格 形式 的 布局 ， 可 以 实现 复杂 的 界面 ， 

调用 子 组 件 的 grid0 方 法 , 则 该 子 组 件 在 其 父 组 件 中 采用 ”图 1-7 pack 几何 布局 续 理 器 
grid 几何 布局 : 
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grid(option=value,...) 
grid0 方 法 提供 了 如 表 1-2 所 示 的 若干 参数 选项 。 
表 1-2 grid() 方 法 提供 的 参数 选项 


选 
sticky 


IOW 


column 


IOWSpan 


ipadx、 ipady 


padx、pady 


grid 几何 布局 管理 锅 有 了 两 个 最 为 重要 的 参数 ， 


项 


描述 
组 件 紧 贴 押 在 单元 格 的 茶 一 边 角 ， 对 应 | 、's'、 
于 东 、 南 、 西 、 北 以 及 4 个 角 


整数 
整数 
整数 
columnspan 整数 


组 件 内 部 在 x/y 方向 上 填充 的 空间 大 小 


组 件 外 部 在 x/y 方向 上 十 充 的 空间 大 小 


一 个 是 row， 男 一 个 是 column， 用 来 指 
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取 值 沁 围 


Le | NW'、 'gW'、 'se'、 


e'、'W'、 'ne'、'center' 


(默认 值 ) 


单位 为 c (厘米 )、m (毫米)、1 (英寸 )、p( 打 
印 机 的 点 》 
单位 为 c (厘米 )、m (之 米 )、i1 (英寸 )、p ( 打 
印 机 的 点 》 


定 将 子 组 件 放置 到 什么 位 置 ， 如 果 不 指定 row， 会 将 子 组 件 放置 到 第 1 个 可 用 的 行 上 ， 如 
果 不 指 定 column， 则 使 用 第 0 列 〈 首 列 )。 
[ 例 ]1-16 grid 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-8 所 示 。 


from tkinter import * 
root=Tk () 
#200x200 代表 了 初始 化 时 主 窗口 的 大 小 ，280 和 280 代表 了 初始 化 时 窗口 所 在 的 位 置 
root -geometry (` 200X200+280+280  ) 
root .title('" 计 算 器 示例 ' ) 
#grid (网 格 ) 布局 


Ll=Button (root, 
L2=Button (root, 
L3=Button (root, 
L4=Button (root, 
L5=Button (root, 
L6=Button (root, 
L7=Button (root, 
L8=Button (root, 
L9=Button (root, 
LO=Button (root, 
Lp=Button (root, 


Ll 
L2 
L3 
L4 
1 
L6 
Te 


.grid (row=0, 
.grid (row=0, 
.grid (row=0, 
.grid (row=1, 
.grid (row=1, 
.grid (row=1, 


.grid (row=2, 


text="1", 
text="2°", 
text="3", 
text="'4"', 
七 eX 七 二 " D " 
text="6°", 
text="7", 
text="8", 
text="9°", 
七 eXt= "0 " ) 
text=".") 


column=0) 
column=1) 
column=2) 
column=0) 
column=1) 
column=2) 


column=0) 


width=5, bg="'yellow') 


widthn=5) 
width=5) 
width=5) 


width=5, bg="'green') 


width=5) 
width=5) 
width=5) 


width=5, bg="'yellow') 


# 按 钮 放置 在 0 行 0 列 
# 按 钮 放置 在 0 行 1 列 
# 按 钮 放置 在 0 行 2 列 
# 按 钮 放置 在 1 行 0 列 
# 按 钮 放置 在 1 行 1 列 
# 按 钮 放置 在 1 行 2 列 
# 按 钮 放置 在 2 行 0 列 
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L8.grid (row=2, column=1) # 按 钮 放置 在 2 行 1 列 

L9.grid (row=2, column=2) # 按 钮 放置 在 2 行 2 列 

L0.grid(row=3, column=0, columnspan=2, sticky=E+W) # 跨 两 列 ， 左 右 贴 紧 
Lp.grid (row=3, column=2, sticky=E+W) # 左 右 贴 紧 


root .mainloop () 

@ place 几何 布局 管理 器 

place 几何 布局 管理 器 允许 指定 组 件 的 大 小 与 位 置 。place 几 
何 布局 管理 器 的 优点 是 可 以 精确 地 控制 组 件 的 位 置 ， 不 足 之 处 
是 改变 窗口 大 小 时 子 组 件 不 能 随 之 灵活 地 改变 大 小 。 

调用 子 组 件 的 方法 place0， 则 该 子 组 件 在 其 父 组 件 中 采用 
place 布局 : 

Place (option=value,**) 

place() 方 法 提供 了 如 表 1-3 所 示 的 若干 参数 选项 , 用户 可 以 图 1-8 grid 几 何 布局 管理 融 
直接 给 参数 选项 赋值 加 以 修改 。 


表 1-3 place() 方 法 提供 的 参数 选项 
选项 取 值 范围 


X,y 将 组 件 放 到 指定 位 置 的 绝对 坐标 从 0 开始 的 整数 

Telx, rely 将 组 件 放 到 指定 位 置 的 相对 坐标 0 一 1.0 

height width | 高 度 和 宽度 ， 单 位 为 像素 

anchor 对 齐 方式 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | 下、'S、'e'、'W、TWwW'、'SwW'、'se'、me'、'center' 


个 角 (默认 值 》 


注意 : Python 的 坐标 系 是 左上 角 为 原点 位 置 (0,0)， 向 右 是 X 坐标 正方 向 ， 向 下 是 y 坐 
标 正方 向 ， 这 和 数学 中 的 几何 坐标 系 不 同 ， 大 家 一 定 要 注意 这 一 点 。 


[ 例 ]1-17 place 几何 布局 管理 器 的 GUI 示例 程序 ， 运 行 效果 如 图 1-9 所 示 。 


from tkinter import * 

root=Tk () 

TOOLO LILICGI Oe) 
root['width']=200;root['height"']=80 


Tabel (Foot,text=" 用 户 名 "width=6) .Place (x=1, y=1) # 绝 对 坐标 (11) 
Entry (root,width=20) .place (x=45, y=1) # 绝 对 坐标 (45, 20) 
Lbeltroot texzt— "i width 6 placelx I vw 20) # 绝 对 坐标 (1, 20) 
Entry (root,width=20, show="'*'") .place (x=45,y=20) # 绝 对 坐标 (45 A 
Rutton(root, text "村 "Width 9) .place(z=40,. y=40) # 绝 对 坐标 (40，, 40) 
Button(root: text WM ' width 38 place(lxz 110 Y=40) # 绝 对 坐标 (110, 40) 


root .malnloop () 


图 1-9 place 几何 布局 管理 器 
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1.4.3 Tkinter 组 件 


Tkinter 提供 了 很 多 组 件 ， 例 如 按钮 、 标 签 和 文本 框 等 ， 在 一 个 GUI 应 用 程序 中 使 用 ， 
这 些 组 件 通 常 被 称 为 控件 或 者 部 件 。Tkinter 组 件 如 表 1-4 所 示 。 
表 1-4 Tkinter 组 件 


控 件 摘 ” 述 
Button 按钮 控件 ， 在 程序 中 显示 按钮 
Canvas 画布 控件 ， 显 示 图 形 元 素 ， 例 如 线条 或 文本 
Checkbutton 多 选 框 控件 ， 用 于 在 程序 中 提供 多 项 选择 框 
Entry 输入 控件 ， 用 于 显示 简单 的 文本 内 容 
Frame 框架 控件 ， 在 屏幕 上 显示 一 个 算 形 区 域 ， 多 用 来 作为 容器 
Label 标签 控件 ， 可 以 显示 文本 和 位 图 
Listbox 列表 框 控件 ， 人 符 串 列表 给 用 户 
Menubutton 菜单 按钮 控件 ， 用 于 显示 菜单 项 
Menu 沫 单 控件 ， 人 下 拉 羔 单 和 弹出 菜单 
Message 消息 控件 ， 用 来 显示 多 行文 本 ， 与 Label 比较 类 似 
Radiobutton 单 选 按钮 控件 ， 显 示 一 个 单 选 的 按钮 状态 
Scale 范围 控件 ， 显 示 一 个 数值 刻度 ， 为 输出 限定 范围 的 数字 区 间 
Scrollbar 滚动 条 控件 ， 在 内 容 超 过 可 视 化 区 域 时 使 用 ， 例 如 列表 框 
Text 文本 控件 ， 用 于 显示 多 行文 本 
Toplevel 容器 控件 ， 用 来 提供 一 个 单独 的 对 话 框 ， 和 Frame 比较 类 似 
Spinbox 输入 控件 ， 与 Entry 类 似 ， 但 是 可 以 指定 输入 范围 值 
PanedWindow PanedWindow 是 一 个 窗口 布局 管理 的 插件 ， 可 以 包含 一 个 或 者 多 个 子 控 件 
LabelFrame LabelFrame 是 一 个 简单 的 容器 控件 ， 和 常用 于 复杂 的 窗口 布局 


tkMessageBox 用 于 显示 应 用 程序 的 消息 框 
通过 组 件 类 的 构造 函数 可 以 创建 其 对 象 实 例 。 例 如 : 


from tkinter import * 
root=Tk () 
button1=Button (root，text=" 确 定 ") # 按 钮 组 件 的 构造 函数 


组 件 的 标准 属性 也 就 是 所 有 组 件 ( 控 件 ) 的 共同 属性 , 例如 大 小 、 字 体 和 颜色 等 。 Tkinter 
组 件 利用 的 标准 属性 如 表 1-5 所 示 。 


表 1-5 Tkinter 组 件 常用 的 标准 属性 


属 性 摘 述 
dimension 控件 大 小 
color 控件 颜色 
font 控件 字体 
anchor 锁 点 《内 容 停靠 位 置 )， 对 应 于 东 、 南 、 西 、 北 以 及 4 个 角 
relief 控件 样式 


位 图 ， 内 置 位 图 包括 error、gray75、gray50、gray25、gray12、info、questhead、 


bitmap hourglass、question 和 warning， 自 定义 位 图 为 .xbm 格式 的 文件 
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属 性 描 述 

cursor 光标 

text 显示 文本 内 容 

state 设置 组 件 状态 为 正常 (normal)、 激 活 (active) 或 禁用 (disabled) 

用 户 可 以 通过 下 列 方式 之 一 设置 组 件 的 属性 。 

buttonl=Button (root,，text=" 确 定 ") # 按 钮 组 件 的 构造 函数 
EECOIIRRCSIEEOUEEZEE 史 下 十 = 一】 # 组 件 对 象 的 config () 方 法 的 命名 参数 
buttonl ["text"]=" 确 定 " # 组 件 对 象 的 属性 的 赋值 

@ 标签 组 件 Label 


Label 组 件 用 于 在 窗口 中 显示 文本 或 位 图 。anchor 属性 指定 文本 (Text) 或 图 像 
(Bitmap/Image) 在 Label 中 的 显示 位 置 〈 如 图 1-10 所 示 ， 其 他 组 件 同 此 )， 对 应 于 东 、 南 、 
西 、 北 以 及 4 个 角 ， 可 用 值 如 下 。 

。e: 王 直 居中 ， 水 平 居 右 。 

。w: 垂直 居中 ， 水 平 后 左 。 

e n: 垂直 届 上 ， 水 平 拓 中 。 

e。 S: 垂直 居 下 ， 水 平 居中 。 

e ne: 垂直 拓 上 ， 水 平 拓 右 。 

e se: 重 直 居 下 ， 水 平 后 右 。 

e SW: 夷 直 拓 下 ， 水 平 拓 左 。 

。nw: 对 和 直 居 上 ， 水 平 居 左 。 

e center 〈 默 认 值 ): 垂直 居中 ， 水 平 拓 中 。 

[ 例 ]1-18 Label 组 件 示例 ， 运 行 效果 如 图 1-11 所 示 。 


from tkinter import * 


win=TKk (); # 创 建 窗口 对 象 

win.title ("我 的 窗口 ") # 设 置 窗口 标题 

labl=Label (win, text="' 你 好 '，anchor="'nw') # 创 建文 字 是 “你 好 ”的 Label 组 件 
Tabl packl) # 显 示 Label 组 件 

# 显 示 内 置 的 位 图 

1ab2=Label (win, bitmap="question") # 创 建 显 示 疑 问 图 标 Label 组 件 
lab2 .pack () # 显 示 Label 组 件 

# 显示 目 选 的 图 所 


bm=PhotoImage (file=r'J:\2018 书稿 \aa .png') 
lab3=Label (win, 1mage=bm) 


l1ab3 .bm=bm 

lab3 .pack () # 显 示 Label 组 件 
win.mainloop() 

从 按钮 组 件 Button 


Button 组 件 (控件 ) 是 一 个 标准 的 Tkinter 部 件 ， 用 于 实现 各 种 按钮 。 按 钮 可 以 包含 文 
本 或 图 像 ， 可 以 通过 command 属性 将 调用 函数 或 方法 关联 到 按钮 上 。 当 Tkinter 的 按钮 被 
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按 下 时 会 目 动 调用 该 函数 或 方法 。 


图 1-10”anchor 地理 方 位 图 1-11 Label 组 件 示例 


全 单行 文本 框 组 件 Entry 和 多 行文 本 框 组 件 Text 
Entry 组 件 主要 用 于 输入 单行 内 容 和 显示 文本 , 可 以 方便 地 回程 序 传 递 用 户 参 数 。 这 里 


通过 一 个 转换 摄氏 度 和 华氏 度 的 小 程序 来 演示 该 组 件 的 使 用 。 


1) 创建 和 显示 Entry 对 象 

创建 Entry 对 象 的 基本 方法 如 下 : 

Entry 对 象 =Entry (Windows 窗口 对 象 ) 

显示 Entry 对 象 的 方法 如 下 : 

Entry 对 象 .pack () 

2) 获取 Entry 组 件 的 内 容 

get() 方 法 用 于 获取 单行 文本 框 内 输入 的 内 容 。 

设置 或 者 获取 Entry 组 件 内 容 也 可 以 使 用 StringVar() 对 象 来 完成 ,把 Entry 的 textvariable 


属性 设置 为 StringVar() 变 量 ， 由 通过 StringVar() 变 量 的 get() 和 setO) 函 数 读 取 和 输出 相应 文 
本 内 容 。 例 如 : 


s=StringVar () 3 ringvar(t) 人 yy 

s.set ("大 家 好 ， 这 是 测试 ") 

entryCd=Entry(lroot, textvariable=s) #Entry 组 件 显示 “大 家 好 ， 这 是 测试 ” 
print (sgeE()) # 打 印 出 “大 家 好 ， 这 是 测试 ” 


3) Entry 的 常用 属性 

show: 如 果 设 置 为 字符 x*， 则 输入 文本 框 内 的 显示 为 *:， 用 于 密码 输入 。 
insertbackground: 插入 光标 的 颜色 ， 默 认为 black'。 

selectbackground 和 selectforeground: 选中 文本 的 背景 色 与 前 景色 。 

width: 组 件 的 宽度 〈 所 占 字 符 个 数 )。 

fg: 字体 的 前 景 颜 色 。 

bg: 背景 颜色 。 

state: 设置 组 件 状态 ， 默 认为 normal， 还 可 设置 为 disabled( 禁 用 组 件 ) 或 readonly 
(只 读 )。 


Python 还 提供 了 多 行文 本 框 组 件 Text， 用 于 输入 多 行内 容 和 显示 文本 。 其 使 用 方法 类 
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似 Entry， 请 读者 参考 Tkinter 手册 。 
@ 列表 框 组 件 Listbox 
列表 框 组 件 Listbox 用 于 显示 多 个 项 目 ， 并 且 人 允许 用 户 选 择 一 个 或 多 个 项 目 。 
1) 创建 和 显示 Listbox 对 象 
创建 Listbox 对 象 的 基本 方法 如 下 : 


Listbox 对 象 =Listbox (Tkinter Windows 窗口 对 象 ) 

显示 Listbox 对 象 的 方法 如 下 : 

Listbox 对 象 .pack () 

2) 插入 文本 项 

用 户 可 以 使 用 insert0 方 法 同 列 表 框 组 件 中 插入 文本 项 ， 方 法 如 下 : 
Listbox 对 象 .insert (index, item) 


其 中 ，index 是 插入 文本 项 的 位 置 ， 如 果 在 尾部 插入 文本 项 ， 则 可 以 使 用 END; 如 果 在 当 
前 选中 处 插入 文本 项 ， 则 可 以 使 用 ACTIVE。item 是 要 插入 的 文本 项 。 
3) 返回 选中 项 目的 索引 


Listbox 对 象 .curselection () 

返回 当前 选中 项 目的 索引 ， 结 果 为 元 组 。 

注意 : 索引 号 从 0 开始 ，0 表示 第 1 项 .。 

4) 删除 文本 项 

Listbox 对 象 .delete (first,1ast) 

删除 指定 范围 frst 一 last 的 项 目 ， 当 不 指定 last 时 删除 1 个 项 目 。 
5) 获取 项 目 内 容 

Listbox 对 象 .get (first,1ast) 

返回 指定 范围 frst 一 last 的 项 目 ， 当 不 指定 last 时 仅 返 回 1 个 项 目 。 
6) 获取 项 目 个 数 

Listbox 对 象 .size() 


7) 获取 Listbox 内 容 
需要 使 用 listvariable 属性 为 Listbox 对 象 指 定 一 个 对 应 的 变量 ， 例 如 : 


m=StringVar () 
listb=Listbox (root, listvariable=m) 
listb.pack () 


root .mainloop () 
指定 后 就 可 以 使 用 m.get(O 方 法 获取 Listbox 对 象 中 的 内 容 了 。 
注意 : 如 果 允 许 用 户 选 择 多 个 项 目 ， 需 要 将 Listbox 对 象 的 selectmode 属性 设置 为 
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MULTIPLE (表示 多 选 )， 而 设置 为 SINGLE 表示 单 选 。 
[ 例 ]1-19 ”创建 从 一 个 列表 框 选择 内 容 添加 到 另 一 个 列表 框 的 GUI 程序 。 


from tkinter import * # 导 入 Tkinter 库 
root=Tk () # 创 建 窗口 对 象 
def callbuttonl(): 

for i in listb.curselection(): # 遍 历 选 中 项 


listb2.insert (0,1istb.get (i)) # 添 加 到 右 侧 列表 框 


def callbutton2(): 


for 1 1in listb2-.curselectiont(): # 遍 历 选 中 项 
listb2.delete (i) # 从 右 侧 列表 框 中 删除 
# 创 建 两 个 列表 
i=I Coven oh hm SO er Tv 
listb=Listbox (root) # 创 建 两 个 列表 框 组 件 
13tD2=LiStbox(troot) 
FoOr tem Tn le: # 左 侧 列 表 框 组 件 插入 数据 


listb.insert (0,item) 
listb.grid(row=0,column=0,rowspan=2) ” 提 将 列表 框 组 件 放 置 到 窗口 对 象 中 
Dl=BaEtonlroot, LexE 二 用 >>T Command=callbuttonl, width=20) 


# 创 建 Button 组 件 
b2=Button (root, text=' 删 除 <<',， command=callbutton2, width=20) 
# 创 建 Button 组 件 
bl .grid (row=0,column=1, rowspan=2) # 显 示 Button 组 件 
b2.grid(row=1,colimn=1, rowspan=2) # 显 示 Button 组 件 


listb2 .grid(row=0,column=2, rowspan=2) 


root .mainloop () # 进 入 消息 循环 
以 上 代码 的 执行 结果 如 图 1-12 所 示 。 


图 1-12 含有 两 个 列表 框 组 件 的 GUI 程序 


人 单 选 按钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 

单 选 按 钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 分 别 用 于 实现 选项 的 单 选 和 复 选 
功能 。Radiobutton 用 于 从 同一 组 单 选 按 钮 中 选择 一 个 单 选 按钮 (不 能 同时 选择 多 个 )。 
Radiobutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。Checkbutton 用 于 选择 一 项 或 多 项 ， 同 样 
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Checkbutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。 
1) 创建 和 显示 Radiobutton 对 象 
创建 Radiobutton 对 象 的 基本 方法 如 下 : 


Radiobutton 对 象 =Radiobutton (Windows 窗口 对 象 , text=Radiobutton 组 件 显示 的 文本 ) 
显示 Radiobutton 对 象 的 方法 如 下 : 
Radiobutton 对 象 .pack () 


用 户 可 以 使 用 variable 属性 为 Radiobutton 组 件 指定 一 个 对 应 的 变量 。 如 果 将 多 个 
Radiobutton 组 件 绑 定 到 同一 个 变量 ， 则 这 些 Radiobutton 组 件 属 于 一 个 分 组 。 分 组 后 需要 
使 用 value 设置 每 个 Radiobutton 组 件 的 值 ， 以 标识 该 项 目 是 否 被 选中 。 

2) Radiobutton 组 件 的 常用 属性 

。 variable: 单 选 按钮 索引 变量 ， 通 过 变量 的 值 确定 哪个 单 选 按钮 被 选中 。 一 组 单 选 按 

钮 使 用 同一 个 索引 变量 。 

。 value: 单 选 按钮 选中 时 变量 的 值 。 

。 command: 单 选 按钮 选中 时 执行 的 命令 (函数 )。 

3) Radiobutton 组 件 的 方法 

e deselect(): 取消 选择 。 

e。 select(): 选择 。 

。 invoke(): 调用 单 选 按钮 command 指定 的 回调 函数 。 

4) 创建 和 显示 Checkbutton 对 象 

创建 Checkbutton 对 象 的 基本 方法 如 下 : 

Checkbutton 对 象 =checkbutton (Tkinter Windows 窗口 对 象 ,text=Checkbutton 组 件 显 
示 的 文本 ， command= 单 击 Checkbutton 按钮 所 调用 的 回调 函数 ) 


显示 Checkbutton 对 象 的 方法 如 下 : 
Checkbutton 对 象 .pack () 


5) Checkbutton 组 件 的 常用 属性 
variable: 复 选 框 索引 变量 ， 通 过 变量 的 值 确 定 哪些 复 选 框 被 选中 。 每 个 复 选 框 使 用 
不 同 的 变量 ， 使 复 选 框 之 间 相 互 独 立 。 
onvalue: 复 选 框 选 中 〈 有 效 ) 时 变量 的 值 。 
offvalue: 复 选 框 未 选中 无效) 时 变量 的 值 。 
command: 复 选 框 选 中 时 执行 的 命令 (函数 )。 
6) 获取 Checkbutton 组 件 的 状态 
为 了 获取 Checkbutton 组 件 是 否 被 选中 ， 需 要 使 用 variable 属性 为 Checkbutton 组 件 指 
定 一 个 对 应 变量 ， 例 如 : 
c=tkinter.Intvar() 


全 二 号 外 二) 
check=tkinter.Checkbutton (oot ,text=' 豆 欢 ， Variable=c onvalue=1l， 
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offvalue=2) #1 为 选中 ，2 为 没 选中 
check .pack () 


指定 变量 后 ， 可 以 使 用 c.getO 获 取 复 选 框 的 状态 值 ， 也 可 以 使 用 c.setO 设 置 复 选 杠 
的 状态 。 例 如 设置 check 对 象 为 没 选 中 状态 ， 代 码 如 下 : 


C-Set (2) #1 为 选中 ，2 为 没 选中 ， 设 置 为 2 就 表示 没 选 中 状态 


获取 单 选 按钮 (了 Radiobutton ) 状态 的 方法 同上 。 
[ 例 ]1-20 创建 使 用 单 选 按 钮 (Radiobutton) 组 件 选择 国家 的 程序 。 


import tkinter 

Eooe FEE pt 

r=tkinter.stringVar () # 创 建 StringVar 对 象 
r.set("'1") # 设 置 初始 值 为 “1”， 初 始 选 中 “中 国 ” 
radio=tkinter. Radioboutton(root, variable=r, value="]", text=" 中 国 ") 
radio.pack () 

radio=tkinter.Radiobutton (root, variable=r, value="'2" ,text=' 关 国 ") 
radio.pack () 
radio=trinter.Radiobutton(root, variable=r, value="3' ,tezxt=" 卓 本 ') 
radio.pack () 

radio=tkinter.Radiobutton (root,variable=r, value="4" ,text=' 加 拿 大 ") 
radio.pack () 

radio=tkinter.Radiobutton (root, variable=r,value="5' ,text="' 韩 国 ') 
radio.pack () 

root .mainloop() 


print (r.get ()) # 获 取 被 选中 单 选 按 钮 变量 值 
以 上 代码 的 执行 结果 如 图 1-13 所 示 。 选 中 日 本 后 打印 出 3。 
@ 菜单 组 件 Menu 


图 形 用 户 界 面 应 用 程序 通 帝 提供 菜单 , 豆单 包含 各 种 按照 主 
题 分 组 的 基本 命令 。 通 第 ,图形 用 户 界 面 应 用 程序 包括 两 种 类 型 
的 荣 单 。 

(1) 主 菜单 : 提供 窗 体 的 菜单 系统 。 通 过 单 击 可 下 拉 出 子 菜 
单 ， 选 择 命令 可 执行 相关 的 操作 。 常 用 的 主 亲 单 一 般 包 括 文件 、 
编辑 、 视 图 、 帮 助 等 。 图 1-13 单 选 按 钮 示例 程序 

(2) 上 下 文 菜 单 ( 也 称 为 快捷 菜单 ): 通过 右 击 某 对 象 而 弹出 的 菜单 ， 一 般 为 与 该 对 
象 相 关 的 音 用 沫 单 命令 ， 例 如 前 切 、 复 制 、 粘 贴 等 。 

创建 Menu 对 象 的 基本 方法 如 下 : 

Menu 对 象 =Menu (Windows 窗口 对 象 ) 

将 Menu 对 象 显示 在 窗口 中 的 方法 如 下 : 


Windows 窗口 对 象 ['menu' ] =Menu 对 象 
Windows 窗口 对 象 .mainloop () 
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框 包 


yesno、okcancel 和 等， 包含 不 同 的 图 标 、 按 钮 以 及 弹 


出 提 


[ 例 ]1-21 使 用 Menu 组 件 的 简单 例子 ， 运 行 效果 如 图 1-14 所 示 。 


from tkinter import * 

root=Tk () 

qdeE HeLlo(]y: # 菜 单项 事件 函数 ， 每 个 羔 单 项 可 以 单独 写 
print ("你 单 击 主 菜单 ") 


m=Menu (root) 


for item in [' 文 件 ', ' 编 辑 ', ' 视 图 ']: # 添 加 菜单 项 
m.add command (label=item, command=hello) 
root ['menu' ]=m # 附 加 主 菜 单 到 窗口 


root .malnloop() 


@ 消息 窗口 组 件 Messagebox 

消息 窗口 组 件 Messagebox 用 于 弹出 提示 框 向 用 
行 告 警 ， 或 让 用 户 选择 下 一 步 如 何 操作 。 消 妃 
括 很 多 类 型 ， 常 用 的 有 info、warning、error、 


一 
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贺 1-22 演示 各 消息 框 的 程序 ， 运 行 效果 如 “图 1-14 使 用 Menu 组 件 的 菜单 运行 效 果 


图 1-15 所 示 。 


import tkinter as tk 
from tkinter import messagebox as msgbox 
def binl cirekedlil: 
msgbox.showinfo("Info", "Showinfo test.") 
亲人 二 ET 
msgbox.showwarning ("Warning", "Showwarning test.") 
def Din cliekedly: 
msgbox.showerror ("Error", "Showerror test.") 
de En eilerediys 
msgbox.askquestion ("Question", "Askquestion test.") 
def DEnSse CTIieredal: 
msgbox.askokcancel ("OkCancel™", "Askokcancel 七 es 七 - ”) 
def Dn clicredly: 
msgbox.askyesno ("YesNo", "Askyesno test.") 
ef Den elickegdty™ 
msgbox.askretrycancel ("Retry", "Askretrycancel test.™") 
root=tk.Tk() 
root.title ("MsgBox Test") 
btnl=tk.Button (root, text="showinfo", command=btnl clicked) 
btnl .pack (fil1l1=tk .xX) 
btn2=tk.Button (root, text="showwarning", command=btn2 clicked) 
btn2 .pack (fil1l1=tk .xXx) 
btn3=tk.Button (root, text="showerror", command=btn3 clicked) 
btn3.pack (fi11l1=tk .xX) 
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btn4=tk.Button (root, text="askquestion", command=btn4 clicked) 
btn4.pack (fil1l1=tk .xX) 

btn5=tk.Button (root, text="askokcancel", command=btn5 clicked) 
btn5.pack (fil1l1=tk .xXx) 

btn6=tk.Button(root, text="askyesno", command=btn6 clicked) 
btn6.pack (fil1l1=tk .xXx) 

btn7=tk.Button (root, text="askretrycancel", command=btn7 clicked) 
btn7 .pack (fil1l1=tk .xX) 


root .mainloop () 


showwarning 


re 
| 
Ez 


图 1-15 消息 窗口 的 运行 效果 


全 框架 组 件 Frame 
Frame 组 件 是 框架 组 件 ， 在 分 组 组 织 其 他 组 件 的 过 程 中 是 非常 重要 的 ， 负 责 安 排 其 他 


组 件 的 位 置 。Frame 组 件 在 屏 人 大 上 显示 为 一 个 矩形 区 域 ， 作 为 显示 其 他 组 件 的 容器 。 


题 ， 


1) 创建 和 显示 Frame 对 象 
创建 Frame 对 象 的 基本 方法 如 下 : 


Frame 对 象 =Frame (窗口 对 象 ，height= 高 度 , width= 宽 度 ,bg= 背 景色 ，...) 
例如 ， 创 建 第 1 个 Frame 组 件 ， 其 高 为 100， 宽 为 400， 背 景色 为 绿色 。 
fl1=Frame (root, height=100,width=400,bg='green') 

显示 Frame 对 象 的 方法 如 下 : 

Frame 对 象 .pack () 


2) 回 Frame 组 件 中 添加 组 件 
在 创建 组 件 时 指定 其 容器 为 Frame 组 件 即 可 ， 例 如 : 


Label (Frame 对 象 ,text='Hello') .pack()  # 癌 Frame 组 件 中 添加 一 个 Label 组 件 


3) LabelFrame 组 件 
LabelFrame 组 件 是 有 标题 的 Frame 组 件 , 可 以 使 用 text 属性 设置 LabelFrame 组 件 的 标 
方法 如 下 : 


LabelFrame (窗口 对 象 ，height= 高 度 , width= 宽 度 , text= 标 题 ) .pack () 
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域 1 


下 面 


[ 例 ]1-23 使 用 两 个 Frame 组 件 和 一 个 LabelFrame 组 件 的 例子 。 


from tkinter import * 


root=Tk () # 创 建 窗 口 对 象 

root .title ("使 用 Frame 组 件 的 例子 ") # 设 置 窗口 标题 

Fl Frame(lroot) # 创 建 第 1 个 Frame 组 件 
Ef42DacEly 

f2=Frame (root) # 创 建 第 2 个 Frame 组 件 
2 Dack(l) 


f3=LabelFrame (root, text=' 第 3 个 Frame') 

# 第 3 个 LabelFrame 组 件 ， 放 置 在 窗口 底部 
f3.pack (side=BOTTOM) 
redbutton=Button (fl], text="Red", fg="red") 
redbutton.pack (side=LEFT) 
brownbutton=Button (fl, text="Brown", fg="brown") 
brownbutton.pack (side=LEFT) 
bluebutton=Button (fl, text="Blue", fg="blue"™) 
bluebutton.pack (side=LEFT) 
blackbutton=Button (f2, text="Black", fg="black") 
blackbutton.pack'() 
greenbutton=Button (f3, text="Green", fg="Green") 
greenbutton.pack () 


root .mainloop () 


以 上 代码 通过 Frame 框架 把 5 个 按钮 分 成 3 个 区 域 ， 第 1 个 区 域 3 个 按钮 ， 第 2 个 区 
个 按钮 ， 第 3 个 区 域 1 个 按钮 ， 运 行 效果 如 图 1-16 所 示 。 


-第 3 个 Frame- 
Green ] | 


图 1-16 ”Frame 框架 的 运行 效果 


4) 刷新 Frame 

用 Python 做 GUI 图 形 界 面 ， 可 以 使 用 after0 方 法 每 隔 几 秒 刷 新 GUI 图 形 界 面 。 例 如 
的 代码 实现 计数 器 功能 ， 并 且 文 字 背 景色 不 断 改 变 。 

from tkinter import * 

colors=("red'", "orange', ‘yellow', “green', '‘'blue', "purple') 

root=Tk () 

f=Frame (root, height=200, width=200) 

-COLor=0 

f['bg']=colors[f.color] # 设 置 框架 背景 色 

labl=Label (f,text="0°") 
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labl .pack () 
def foo() : 
ff.color=(f.color+il}${lent(colors})) 
ap colnrestE eolorl 
1ablT'text"]=str (1int (labll'text"]})+1) 
f.after(500，foo)  # 隔 500 ms 执行 f00() 函数 刷新 屏幕 
spackt) 
fF-after(00. fon) 


root .mainloop() 


例如 开发 移动 电子 广告 效 果 就 可 以 使 用 after0 方 法 实现 不 断 移动 labl。 
from tkinter import * 
root=Tk () 
f=Frame (root, height=200, width=200) 
labl=Label (f, text=' 欢 迎 参观 中 原 工学 院 ') 
x=0 
def foo() : 

global x 

X=X+10 

TE x200 

X=0 
labl .place (x=x, y=0) 
f.after(500，foo)  # 隔 500 ms 执行 f00() 函数 刷新 屏幕 


f .pack () 
taltter(s00 oo 
root .mainloop() 


运行 程序 可 见 “ 欢 迎 参 观 中 原 工学 院 ” 不 停 地 从 左 同 右 移动 ， 出 了 窗口 右 侧 以 后 重新 


从 左 侧 出 现 。 利 用 此 技巧 可 以 开 友 类 似 的 贫 吃 蛇 游 戏 ， 借 助 after0 方 法 实现 不 断 改 变 蛇 的 
位 置 ， 从 而 达到 蛇 移 动 的 效果 。 


1.4.4 Tkinter 字体 


通过 组 件 的 font 属性 可 以 设置 其 显示 文本 的 字体 ,注意 在 设置 组 件 字 体 前 首先 要 能 


示 一 个 字体 。 


@ 通过 元 组 表示 字体 
通过 3 个 元 素 的 元 组 可 以 表示 字体 : 


(font family,size,modifiers) 


作为 一 个 元 组 的 第 1 个 元 素 的 font family 是 字体 名 ; size 为 字体 大 小 ， 单 位 为 point; 


modifiers 为 包含 粗 体 、 笠 体 、 下 男 线 的 样式 修饰 符 。 


例如 : 


("Times New Roman ", "16") #16 点 阵 的 Times 字体 
("Times New Roman "，"24"，"boldq italicn)#24 点 阵 的 Times 字体 ， 且 为 粗 体 、 斜 体 
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[ 例 ]1-24 通过 元 组 表示 字体 设置 标签 的 字体 ， 运 行 效果 如 图 1-17 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 Label 

tor EEC "Aral "SCourier Mem 19 La le (Comec Sans Ms ry; Fixdsys’, 

('MS Sans Serif"',), ('MS Serif"',),"'Symbol','System', ('Times New Roman',),'Verdana'): 
Label (root, text="'hello sticky',font=ft) .grid!() 


root .mainloop() 


这 个 程序 在 Windows 上 测试 字体 显示 , 注意 字体 中 包 合 


有 空格 的 字体 名 称 必须 指定 为 元 组 类 型 。 hello sticky 
@ 通过 Font 对 象 表示 字体 Ee pi 
使 用 tkFont.Font 来 创建 字体 ， 格式 如 下 : hello sticky 
hello sticky 
ft=tkFont.Font (family=" 字体 名 ', size， weight, hello sticky 
slant, underline, overstrike) miE 人 NO OTKY 
hello sticky 
其 中 ，slze 为 字体 大 小 ; welght='bold' 或 mnormal'"，'bold' 为 粗 hello sticky 
体 ;slant='italic' 或 mormal'，'italic' 为 和 斜体 ，underline=1 或 0， et 
] 为 下 男 线 ; overstrike=] 或 Us 1 为 删除 线 。 图 1]1-17 缩放 图 形 对 象 运行 效果 


ft=Font (family="'Helvetica',size=36,weight="'bold') 
[ 例 ]1-2s 通过 Font 对 象 设置 标签 字体 ， 运 行 效果 如 图 1-18 所 示 。 
# 通 过 Font 对 象 来 创建 字体 


from tkinter import * 

import tkinter.font #3 引入 字体 模块 
root=Tk () 

# 指 定 字 体 名 称 、 大 小 、 样 式 

ft=tkinter.font.Font (family="'Fixdsys',size=20,welight="'bold') 
Label (root, text="'hello sticky',font=ft) .grid() # 创 建 一 个 Label 

root .malnloop () 


通过 tkFont. families() 函 数 可 以 返回 所 有 可 用 的 字体 。 


from tkinter import * 多 tk | © mm 
import tkinter.font #3 引入 字体 模块 hello stick 
root=TKk () 

print (tkinter.font.families()) 图 1-18 通过 Font 对 象 设置 标签 字体 
输出 结果 : 


("Forte', "Felix TIL1Ing "Eras Medium ITC', "Eras Light IIC “Eras Demi 
工 TC Eras Bold ITC "Engravers MI "Elephant "Erardian Seript ITC 
'Curlz MT', ‘'Copperplate Gothic Light', 'Copperplate Gothic Bold', 'Century 
Schoolbook" "Castellar "CaLlisto MI "Boorman Old Stvle' "BodonL' WMT 
Condensed', 'Bodoni MT Black', 'Bodoni MT', 'Blackadder ITC', 'Arial Rounded 
MT Bold', ‘'Agency FB', '‘'Bookshelf Symbol 7', 'MS Reference Sans Serif', 'MS 
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Reference Specialty', 'Berlin Sans FB Demi', 'Tw Cen MT Condensed Extra Bold' ， 
'Calibri Light',，'Bitstream Vera Sans Mono'，' 方 正 兰 享 超 细 黑 简体 '"，'@ 方 正 兰 襄 
超 细 黑 简 体 '，'Buxton Sketch', 'Segoe Marker', 'SketchFlow Print') 


1.4.5 Python 事件 处 理 


所 谓 事件 (Event)， 就 是 程序 上 发 生 的 事 。 例 如 用 户 敲 击 键盘 上 的 蘑 
一 个 键 或 是 单 击 、 移 动 鼠 标 。 对 于 这 些 事件 ， 程 序 需要 做 出 反应 。Tkinter 
提供 的 组 件 通常 都 有 自己 可 以 识别 的 事件 。 例 如 当 按钮 被 单 击 时 执行 特定 


容 束 会 显示 在 输入 栏 内 。 
程序 可 以 使 用 事件 处 理 函 数 来 指定 当 触 上 友 示 个 事件 时 所 做 的 反应 《操作 )。 
@ 事件 类 型 
事件 类 型 的 通用 格式 如 下 : 


<[modifier-]**“type[-detail]> 

事件 类 型 必须 放置 于 尖 插 与 <> 内 。type 摘 述 了 类 型 , 例如 键盘 按键 、 鼠 标 单 击 .modifier 
用 于 组 合 键 定 义 ， 例 如 Control、Alt。detail 用 于 明确 定义 是 哪 一 个 键 或 按钮 的 事件 ， 例 如 
1 表示 鼠标 左 键 、2 表示 鼠标 中 键 、3 表示 鼠标 右键 。 


举例 如 下 : 
<Button-1> # 按 下 鼠标 左 键 
<KeyPress-A> # 按 下 键盘 上 的 A 键 
<Control-Shift-KeyPress-A> # 同 时 按 下 了 Control、Shift、A 3 个 键 
在 Python 中 ， 键 盘 事 件 见 表 1-6， 和 鼠标 事件 见 表 1-7， 窗 体 事件 见 表 1-8。 
表 1-6 ”键盘 事件 
名 称 描 述 
KeyPress 按 下 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
KeyRelease 释放 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
表 1-7 鼠标 事件 
名 称 描 ” 述 
ButtonPress 或 Button 按 下 鼠标 茶 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
ButtonRelease 释放 鼠标 某 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
Motion 点 中 组 件 的 同时 拖 电 组 件 移动 时 触发 
Enter 当 鼠 标 指针 移 进 某 组 件 时 触发 
Leave 当 鼠 标 指 针 移 出 某 组 件 时 触发 
MouseWheel 当 鼠 标 滚轮 滚动 时 触发 
表 1-8 窗 体 事件 
名 称 描 述 
Visibility 当 组 件 变 为 可 视 状 态 时 触 友 
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续 表 
名 称 描 述 
Unmap 当 组 件 由 显示 状态 变 为 隐藏 状态 时 触发 
Map 当 组 件 由 隐藏 状态 变 为 显示 状态 时 触发 
Expose 当 组 件 从 原本 被 其 他 组 件 遮 益 的 状态 中 暴露 出 来 时 触发 
FocusIn 当 组 件 获得 焦点 时 触发 
FocusOnut 当 组 件 失 去 焦点 时 触发 
Configure 当 改 变 组 件 大 小 时 触发 ， 例 如 拖 电 窗 体 边 缘 
Property 当 窗 体 的 属性 被 删除 或 改变 时 触发 ， 属 于 Tk 的 核心 事件 
Destroy 当 组 件 被 销毁 时 触发 


与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 不 可 用 转 为 可 用 ， 例 如 按钮 由 
disabled (灰色 ) 转 为 enabled 


与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 可 用 转 为 不 可 用 ， 例 如 按钮 由 
enabled 转 为 disabled (灰色 ) 


modifier 组 合 键 定义 中 常用 的 修饰 符 见 表 1-9。 
表 1-9 ”组合 键 定义 中 常用 的 修饰 符 


Activate 


Deactivate 


修 饰 符 摘 述 
Alt Alt 键 按 下 
Any 任何 按键 按 下 ， 例 如 <Any-KeyPress> 
Control Control 键 按 下 
Double 两 个 事件 在 短 时 间 内 发 生 ， 例 如 双击 鼠标 左 键 <Double-Button-1> 
Lock Caps Lock 键 按 下 
Shift Shift 键 按 下 
Triple 类 似 于 Double，3 个 事件 短 时 间 内 发 生 


可 以 用 短 格式 表示 事件 ， 例 如 <1> 等 同 于 <Button-1>、<x> 等 同 于 <KeyPress-x>。 

对 于 大 多 数 的 单字 符 按键 ， 用 户 还 可 以 忽略 “<>” 符 号， 但 是 空格 键 和 人 尖 括 号 键 不 能 
这 样 做 (正确 的 表示 分 别 为 <space>、<less>)。 

从 事件 绑 定 

程序 建立 一 个 处 理 茶 一 事件 的 事件 处 理 函 数 称 为 绑 定 。 

1) 创建 组 件 对 象 时 指定 

在 创建 组 件 对 象 实例 时 ， 可 以 通过 其 命名 参数 command 指定 事件 处 理 函 数 。 例 如 : 

def callback() : # 事 件 处 理 函 数 

Showlinfo ("Python command", "人 生 苗 短 ， 我 用 Pythnon”) 


Bul=Button (oot，text=" 设 置 command 事件 调用 命令 ", command=callback) 
Bul .pack () 


2) 实例 绑 定 

调用 组 件 对 象 实例 方法 bind0 可 以 为 指定 组 件 实例 绑 定 事件 ， 这 是 最 党 用 的 事件 绑 定 
pi 

组 件 对 象 实例 名 .bind ("< 事件 类 型 >"， 事 件 处 理 函 数 ) 

例如 ， 假 如 声明 了 一 个 名 为 canvas 的 Canvas 组 件 对 象 ， 想 在 canvas 上 按 下 鼠标 左 键 
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时 国 一 条 线 ， 可 以 这 样 实现 : 
canVas .blnd ("<Button-1>"，dqrawlLline) 


其 中 ，bind 函数 的 第 1 个 参数 是 事件 描述 待 ， 指 定 无 论 什 么 时 候 在 canvas 上 ， 当 按 下 鼠标 
左 键 时 就 调用 事件 处 理 函 数 drawline 进行 画 线 的 任务 。 特 别 需 要 说 明 的 是 ，drawline 后 面 
的 圆 括 号 是 省 略 的 ，Tkinter 会 将 此 函数 十 入 相关 参数 后 调用 运行 ， 在 这 里 只 是 声明 
而 已。 

3) 标识 绑 定 

在 Canvas 国 布 中 绘制 各 种 图 形 , 将 图 形 与 事件 绑 定 可 以 使 用 标识 绑 定 函数 tag bind()。 
预先 为 图 形 定 义 标 识 tag 后 ， 通 过 标识 tag 来 绑 定 事件 。 例 如 : 


cv bag Dand(t ri BEEOD EL TIDERECGJ 
[ 例 ]1-26 标识 绑 定 的 例子 。 


from tkinter import * 
root=Tk () 
def printRect (event): 

print ('rectangle 左 键 事件 ') 
def printRect?2 (event): 

print ('rectangle 右键 事件 ') 
def printLine (event): 

print ('Line 事件 ') 


Co=Canvastiroot De whate # 创 建 一 个 Canvas， 设 置 其 背景 色 为 白色 
rtl=cv.create rectanglel( 

I i Ra 

width=8, tags="rl1"') 
cv.tag bind('rl','<Button-1>',printRect) # 绑 定 item 与 鼠标 左 键 事件 
cv.tag bind('rl','<Button-3>',printRect2)  # 绑 定 itenm 与 鼠标 右键 事件 
# 创 建 一 个 Line， 并 将 其 tags 设置 为 'r2" 
cv.create line(180,70,280,70,width=10,tags="'r2"') 
cv.tag bind('r2','<Button-1>',printLine) # 绑 定 item 与 鼠标 左 键 事件 
CV-Pack () 
root .malnloop() 


在 这 个 示例 中 , 单 击 到 和 矩形 的 边框 时 才 会 触 友 事件 , 窍 形 既 啊 应 鼠标 左 键 义 啊 应 右键 。 
当 用 鼠标 左 键 单 击 矩形 边框 时 出 现 “rectangle 左 键 事 件 ” 信 息 ， 用 鼠标 右键 单 击 和 矩形 边框 
时 出 现 “rectangle 右键 事件 ”信息 ， 用 鼠标 左 键 单 击 直线 时 出 现 “Line 事件 ”信息 。 

@@ 事件 处 理 函 数 

1) 定义 事件 处 理 函 数 

事件 处 理 函 数 往往 市 有 一 个 event 参数 , 在 触 友 事 件 调 用 事件 处 理 函 数 时 将 传递 Event 
对 象 实例 。 

def Cal1back (evenEs # 事 件 处 理 函 数 

showinfo("Python command", ”人 生 兰 短 ， 我 用 python”) 
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2) Event 对 象 的 参数 
Event 对 象 可 以 获取 各 种 相关 参数 ， 主 要 参数 如 表 1-10 所 示 。 


参 数 


了 
.xX TOOt,.y root 


.keysym 


.keysym num 
.keycode 
.time 

-type 


.Widget 
.char 


表 1-10 ”Event 对 象 的 主要 参数 
说 明 

鼠标 相对 于 组 件 对 象 左上 角 的 坐标 
鼠标 相对 于 屏幕 左上 角 的 坐标 
字符 串 命名 按键 ， 例 如 Escape、F1 一 F12、Scroll Lock、Pause、JInsert、Delete、 
Home、Prior (这 个 是 page up) 、Next (这 个 是 page down) 、End、Up、Right、 
Left、 Down、Shift L、 Shift R、 Control L、 Control R、Alt L、Alt R、Wimn L 
数字 代码 命名 按键 
键 码 ， 但 是 它 不 能 反映 事件 前 级 Alt、Control、Shift、Lock， 并 且 它 不 区 分 大 小 
写 按键 ， 即 输入 a 和 A 是 相同 的 键 码 


时 间 

事件 类 型 
触及 事件 的 对 应 组 件 
字符 


Event 对 象 按 键 的 详细 信息 如 表 1-11 所 示 。 


.keysym 
Alt L 
Alt R 
BackSpace 
Cancel 
Fl1~F1l1]l 
Print 


表 1-11 Event 对 象 按 键 的 详细 信息 


说 二 

天 于 边 拘 AI 全 
手边 的 At 刍 
| em | ”PoweBreak 鱼 
功能 刍 F1~F1I 
| 637 | ”人 条 印 屏 人 


[ 例 ]1-27 触发 keyPress 键盘 事件 的 例子 ， 运 行 效果 如 图 1-19 所 示 。 


from tkinter import * # 导 入 Tkinter 库 

def printkey (event): # 定 义 的 函数 监听 键盘 事件 
print (' 你 按 下 了 : '+event .char) 

POGE= TE(Y # 实 例 化 tk 

entry=Entry (root) # 实 例 化 一 个 单行 输入 框 


# 给 输入 框 绑 定 按键 监听 事件 <KeyPress> 为 监听 任何 按键 
#<KeyPress-x> 为 监听 某 键 x， 例 如 <KeyPress-A> 为 监听 A、<KeyPress-Return> 为 监听 回 车 
entry.bind('<KeyPress>', printkey) 


entry.pack () 


root .mainloop () # 显 示 窗 体 


helloxnnj 
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7 
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图 1-19 ”keyPress 键盘 事件 运行 效果 
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[ 例 ]1-28 获取 鼠标 单 击 标签 时 坐标 的 鼠标 事件 例子 ， 运 行 效果 如 图 1-20 所 示 。 


from tkinter import * # 导 入 Tkinter 库 
def TeTttClick(event)es # 定 义 的 函数 监听 鼠标 事件 
print ("x 轴 坐 标 :"，event .x) 
print ("y 轴 坐 标 :"，event .y) 
print (" 相 对 于 屏幕 左上 角 x 轴 坐 标 :"，event .x root) 
print ("相对 于 屏幕 左上 角 y 轴 坐 标 :"， event .y root) 


roGt=TE() # 实 例 化 tk 
lab=Label (root, text="hello") # 实 例 化 一 个 Label 
1 pacCk() # 显 示 Label 组 件 
# 给 Label 绑 定 鼠 标 监听 事件 
1ab .blind ("”<Button-1>” 1eftCl1cK) 
root .mainloop() # 显 示 窗 体 

2 


Phtht™ ™ 


寺村: 经 
莘 生 入: 30" 
莘 生 入: 3 


图 1-20 鼠标 事件 运行 效果 


1.4.6 ”图 形 宕 面 设计 应 用 案例 一 一 开发 猜 数 字 游 戏 


【和 案例】 使 用 Tkinter 开发 猜 数 学 游戏 ， 运 行 效果 如 图 1-21 所 示 。 
在 该 游戏 中 ， 计 算 机 随机 生成 1024 以 内 的 数字 ， 玩 家 去 猜 ， 猜 的 数字 过 大 、 过 小 都 会 给 
出 提示 ， 程 序 要 统计 玩家 猜 的 次 数 。 


import tkinter as tk 


二 
1 
沂 币 


yd re yq 
本 
“nn a 
故 攻 = om 狼 抽 一 oo 猎手- 


润 油 


Fr Fr 


和 生生 
酒 符 再 弄 开外 


性 禾 


111 
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一 中 一 
DD 
Fr 


二 


import random 


number=random.randint (0,1024) # 玩 家 要 猜 的 数字 

running=True 

num=0 # 猜 的 次 数 

nmaxn=1024 # 提 示 猜 测 范 围 的 最 大 数 

nminn=0 # 提 示 猜 测 范 围 的 最 小 数 

def eBtnClose (event) : #“ 关 闭 ” 按 钮 事件 函数 
root .destroy() 

def eBtnGuess (event) : #“ 猜 ”按钮 事件 函数 
global nmaxn # 全 局 变量 


global nminn 
global num 


global running 


55 | 


P 项 目 案例 开发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


if running: 
val a sint (entry dgct()) # 获 取 猜 的 数字 并 转换 成 数字 
if val a==number: 
labelqval (" 恭 嘉 答 对 了 ! ") 
num+=1 


running=False 


numGuess () # 显 示 猜 的 次 数 
elif val a<number: # 猜 小 了 
if val a>nminn: 
nminn=val a # 修 改 提示 猜测 范围 的 最 小 数 
num+=1] 
labelqval ("小 了 哦 ,请 输入 "+str (nminn) +" 到 "+str (nmaxn) +" 之 间 任 意 
整数 : ") 
else: 


a 


nmaxn=val a # 修 改 提 示 猜 测 范 围 的 最 大 数 
num+=1] 
labelgqval ("大 了 哦 ,请 输入 "+str (nminn) +" 到 "+str (nmaxn) +" 之 间 任 意 
整数 : ") 
else: 
labelqval (' 你 已 经 答对 啦 . . . ') 
# 显 示 猜 的 次 数 
def numGuess () : 
if num==1: 


labelqval(' 一 次 答对 !') 
elif num<10: 
labelqval('== 十 次 以 内 就 答对 了 牛 。。。 尝 试 次 数 : '+str (num) ) 


else: 


labelqval(' 好 吧 ， 您 都 试 了 超过 10 次 了 。。。。 尝 试 次 数 : '+str (num) ) 


def labelqval (VIext) : 
label val q.config(label val q,text=vText) # 修 改 提示 标签 文字 


root=tk.Tk (className=" 猜 数字 游戏 ") 

root .geometry ("400x90+200+200") 

label val q=tk.Label (root,width="80") # 提 示 标 签 
label val q.pack (side="top") 


entry a=tk.Entry (root,width="40") # 单 行 输入 文本 框 
btnGuess=tk.Button (Foot ,text=" 猜 ") #“ 猜 ”按钮 
entry a.pack (side="]left") 

entry a.bind('<Return>',eBtnGuess) # 绑 定 事件 
btnGuess.bind('<Button-1>',eBtnGuess) #“ 猜 ”按钮 


btnGuess.pack(slde="1Left") 
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btnClose=tk.Button (root, text=" 关 闭 ") #“ 关 闭 ” 按 钮 
btnClose.bind('<Button-1>',eBtnClose) 

btnClose.pack (side="left") 

labelqval ("请 输入 0 到 1024 之 间 任 意 整数 : ") 

Etey sitoruseaetty 

print (number) 


root .malnloop () 


小 了 哦 ,请 输入 100 到 567 之 间 任 意 整 数 : = = 十 次 以 内 就 答对 了 牛 。。。 尝 试 次 数 : 3 


DE DE 


图 1-21 猜 数 字 游 戏 运行 效果 


1.5 ”Python 文件 的 使 用 


或 关机 后 束 会 消失 。 如 果 想 要 在 下 次 开机 运行 程序 时 还 使 用 同样 的 数据 ， 
束 需 要 把 数据 存储 在 不 易 失 的 存储 介质 中 ， 例 如 硬盘、 光盘 或 UU 盘 里 ,不 
易 失 存储 介质 上 的 数据 保存 在 以 存储 路 径 命 名 的 文件 中 。 通 过 读 / 写 文件 ， rer 
程序 就 可 以 在 运行 时 保存 数据 。 本 节 学 习 使 用 Python 在 磁盘 上 创建 、 读 / ”视频 讲解 
写 以 及 关闭 文件 。 

使 用 文件 跟 人 们 在 平时 生活 中 使 用 记事 本 很 相似 。 在 使 用 记事 本 时 需要 先 打 开本 子 ， 
使 用 之 后 要 合 上 它 。 在 打开 记事 本 后 ， 既 可 以 读 取 信息 ， 也 可 以 向 本 子 里 写 。 不 管 是 哪 种 
情况 ， 都 需要 知 估 在 哪里 进行 读 / 写 。 在 记事 本 中 既 可 以 一 页 一 页 从 头 到 尾 地 谈 ， 也 可 以 直 
接 跳 转 到 需要 的 地 方 。 

在 Python 中 对 文件 的 操作 通常 按照 以 下 3 个 步骤 进行 : 

(1) 使 用 open0 函 数 打开 (或 建立 ) 文件 ， 返 回 一 个 flle 对 象 。 

(2) 使 用 file 对 象 的 读 / 写 方法 对 文件 进行 读 / 写 操作 。 其 中 ， 将 数据 从 


写 操作 。 
(3) 使 用 fle 对 象 的 close0 方 法 关闭 文件 。 


1.5.1 打开 /建立 文件 


在 Python 中 要 访问 文件 ,必须 打开 Python Shell 与 磁盘 上 文件 之 间 的 连接 。 在 使 用 opengO) 
函数 打开 或 建立 文件 时 会 建立 文件 和 使 用 它 的 程序 之 间 的 连接 ， 并 返回 代表 连接 的 文件 对 
象 ， 通 过 文件 对 象 就 可 以 在 文件 所 在 的 磁盘 和 程序 之 间 传 递 文 件 内 容 ， 执 行文 件 上 的 所 有 
后 续 操 作 。 文 件 对 象 有 时 也 称 为 文件 摘 述 符 或 文件 流 。 
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在 建立 了 Python 程序 和 文件 之 间 的 连接 后 就 创建 了 “ 流 ” 数 据 ， 如 图 1-22 所 示 。 通 
音 ， 程 序 使 用 输入 流 读 出 数据 ， 使 用 输出 流 写 入 数据 ， 就 好 像 数 据 流 入 到 程序 并 从 程序 中 
流出 。 在 打开 文件 后 才能 读 或 写 ( 或 读 并 且 写 ) 文件 内 容 。 


输入 设备 输出 设备 
= 一 一 输入 流 输出 流 
执行 程序 
标准 输入 /输出 
输入 流 输出 流 
输入 文件 执行 程序 输出 文件 
文件 输入 /输出 


图 1-22 输入 /输出 流 


open() 函 数 用 来 打开 文件 。open0 函 数 需 要 一 个 字符 串 路 人 径 ， 表 明 希 望 打 开 文 件 ， 并 返 
回 一 个 文件 对 象 。 其 语法 格式 如 下 : 


fileob]=open (filename[,model[,buffering]l]) 


其 中 ，fileob]j 是 open0 函 数 返 回 的 文件 对 象 。 参 数 filename (文件 名 ) 是 必 写 参数 ， 它 既 可 
以 是 绝对 路 径 ， 也 可 以 是 相对 路 径 。 模 式 (mode) 和 缓冲 (buffering) 为 可 选项 。mode 
是 指明 文件 类 型 和 操作 的 字符 串 ， 可 以 使 用 的 值 如 表 1-12 所 示 。 


表 1-12 open() 函 数 中 mode 参数 的 常用 值 
值 描 述 
中 读 模 式 ， 如 果 文 件 不 存在 ， 则 发 生 异 常 
Wi’ 写 模式 ， 如 果 文 件 不 存在 ， 则 先 创 建文 件 再 打开 ; 如果 文件 存在 ， 则 清空 文件 内 容 再 打开 
追加 模式 ， 如 果 文 件 不 存在 ， 则 先 创 建文 件 再 打开 ; 如 果 文 件 存 在 ， 打 开 文 件 后 将 新 内 容 追 
加 到 原 内 容 之 后 


b' 二 进 制 模式 ， 可 添加 到 其 他 模式 中 使 用 

+ 读 / 写 模式 ， 可 添加 到 其 他 模式 中 使 用 

(1) 当 mode 参数 省 略 时 ， 可 以 获得 能 读 取 文件 内 容 的 文件 对 象 ， 即 7 是 mode 参数 的 
默认 值 。 

(2) "+ 参数 指明 读 和 写 都 是 允许 的 ， 可 以 用 到 其 他 任何 模式 中 。 例 如 ， 可 以 用 'rt 打 开 
一 个 文本 文件 并 读 / 写 。 


(3) 了 b' 参 数 改 变 处 理 文件 的 方法 。 通 常 ，Python 处 理 的 是 文本 文件 ， 当 处 理 二 进 制 文 
件 ( 例 如 声 首 文件 或 图 像 文 件 ) 时 应 该 在 模式 参数 中 增加 b'。 例 如 ， 可 以 用 'rb' 来 读 取 一 个 
二 进 制 文件 。 

open0 函 数 的 第 3 个 参数 一 一 buffering 用 来 控制 缓冲 。 当 该 参数 取 0 或 False 时 ，LO 
是 无 缓冲 的 ， 所 有 读 / 写 操作 直接 针对 硬盘。 当 访 参数 取 1 或 True 时 ，LO 有 绥 冲 ， 此 时 
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Python 使 用 内 存 代 葵 人 硬盘 ， 使 程序 的 运行 速度 更 快 ， 只 有 在 使 用 flush0) 或 closeO 时 才 会 将 
数据 写 入 人 硬盘。 当 参 数 大 于 1 时 ， 表 示 绥 冲 区 的 大 小 ， 以 字 节 为 单位 ;负数 表示 使 用 默认 
缓冲 区 大 小 。 

下 面 举例 说 明 open0 〇 函数 的 使 用 。 

先 用 记事 本 创建 一 个 文本 文件 ， 取 名 为 hello.txt， 然 后 输入 以 下 内 容 ， 保 存在 D 盘 的 
python 文件 夹 中 : 

Hello! 


Henan Zhengzhou 
在 交互 式 环境 中 输入 以 下 代码 : 
>>> helloFile=open("D:\\python\\hello.txt") 


这 条 命令 将 以 读 取 文 本 文件 的 方式 打开 放 在 D 盘 Python 文件 夹 下 的 hellotxt 文 件 “ 读 
模式 ”是 Python 打开 文件 的 默认 模式 。 当 文件 以 谈 模 式 打开 时 ， 只 能 从 文件 中 读 取 数据 ， 
不 能 同文 件 写 入 或 修改 数据 。 

当 调 用 open0) 函 数 时 将 返回 一 个 文件 对 象 , 在 本 例 中 文件 对 象 保存 在 helloFile 变量 中 。 

>>> print (helloFile) 

< 10.TextIOWrapper name="D:\\python\\hello.txt"' mode='r' encoding="'cp936'> 


在 打印 文件 对 象 时 可 以 看 到 文件 名 、 读 / 写 模式 和 编码 格式 。cp936 是 指 Windows 系统 
中 的 第 936 号 编码 格式 ， 即 GB2312 的 编 权 。 接 下 来 就 可 以 调用 helloFile 文件 对 象 的 方法 
恋 取 文件 中 的 数据 了 。 


1.5.2 ” 读 取 文本 文件 


用 户 可 以 调用 文件 对 象 的 多 种 方法 读 取 文件 内 容 。 

@ read0 方 法 

不 设置 参数 的 read() 方 法 将 整个 文件 的 内 容 读 取 为 一 个 字符 串 。read() 方 法 一 次 读 取 文 
件 的 全 部 内 容 , 性 能 根据 文件 大 小 而 变化 , 例如 1GB 的 文件 在 读 取 时 需要 使 用 同样 大 小 的 
内 存 。 


[ 例 ]1-29 调用 read() 方 法 读 取 hello.txt 文件 中 的 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
FieGContent hellorrie reread 
helloFile.close() 

print (fileContent) 

输出 结果 : 

Hello! 


Henan Zhengzhou 


用 户 也 可 以 设置 最 大 读 入 字符 数 来 限制 read0O) 函 数 一 次 返回 的 大 小 。 
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[ 例 ]1-30 设置 参数 一 次 读 取 3 个 字符 来 读 取 文件 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent="" 
whileTrue: 
fragment=helloFile.read(3) 
LT Fragent = # 或 者 if not fragment 
break 
fileContent+=fragment 
hellorFile. closet) 
print (fileContent) 


在 读 到 文件 结尾 之 后 , read(0) 方 法 会 返回 空 字符 串 ， 此 时 fragment=="" 成 立 , 退出 循环 。 
@ readline(0 方 法 

readline() 方 法 从 文件 中 获取 一 个 字符 串 ， 每 个 字符 串 就 是 文件 中 的 每 一 行 。 

[ 例 ]1-31 调用 readline(0) 方 法 读 取 hello.txt 文件 中 的 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent="" 
whileTrue: 
Ine NeliliorFile readlinel) 
if Tine=—"w: # 或 者 if not line 
break 
fileContent+=line 
nellorilie Closel) 
print (fileContent) 


当 读 取 到 文件 结尾 之 后 ，readline(0 方 法 同样 返回 空 学 从 串 ， 使 得 ine 一" 成立， 跳出 
循环 。 

全 readlines() 方 法 

readlines() 方 法 返回 一 个 字符 串 列表 ， 其 中 的 每 一 项 是 文件 中 每 一 行 的 字符 串 。 

[ 例 ]1-32 ”使 用 readlines0 方 法 读 取 文件 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent=hellorile. readlinest{) 
nelioriiles elLosel() 

print (fileContent) 

for line in fileContent:  # 输 出 列表 


print (line) 


readlines() 方 法 也 可 以 设置 参数 ， 指 定 一 次 读 取 的 字符 数 。 


1.5.3” 写 文本 文件 


写 文件 和 读 文件 相似 ， 都 需要 先 创 建文 件 对 象 连接 ， 所 不 同 的 是 ， 打 视频 讲解 
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开 文件 时 是 以 写 模式 或 添加 模式 打开 。 如 果 文件 不 存在 ， 则 创建 该 文件 。 
与 读 文 件 时 不 能 添加 或 修改 数据 类 似 ， 写 文件 时 也 不 允许 读 取 数 据 。 在 用 写 模式 打开 
已 有 文件 时 会 覆盖 文件 的 原 有 内 容 ， 从 头 开始 ， 就 像 用 一 个 新 值 覆 写 一 个 变量 的 值 。 


>>> helloFile=open("D:\\python\\hello.txt","w") 
# 用 写 模 式 打开 已 有 文件 时 会 履 盖 文件 的 原 有 内 容 
S57 Tleconten elliorileoreaat) 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 

FileContent neliornnie readll 

IOError: File not open for reading 

elLlorile cloael) 

>>> hellorFile=open("D:\\python\\hello.txt") 

EeecenenEeToETes ea 

TenFEITECoOnEEmE) 

0 

SS ellorFilie cloasel() 


由 于 用 写 模式 打开 已 有 文件 时 文件 的 原 有 内 容 被 清空 , 所 以 再 次 读 取 内 容 时 长 度 为 0。 
@ write0 方 法 

write() 方 法 用 于 将 字符 串 参 数 写 入 文件 。 

[ 例 ]1-33 用 write( 方 法 写 文件 。 
helloFile=open("D:\\python\\hello.txt","w") 
helloryie Write(leErrost line nsecongd LIne An 
hellorile Closel) 
helloFile=open("D:\\python\\hello.txt","a") 
neliorTieawrite Enrrd line ss] 

heliorilie closet) 
helloFile=open("D:\\python\\hello.txt") 
filecContent helLlorile readl) 


helliorile elosert) 
print (fileContent) 


运行 结果 : 


First line. 
Second Ti1ne. 
third Ti1ne. 


当 以 写 模式 打开 文件 hello.txt 时 ， 文 件 的 原 有 内 容 被 禾 新 。 调 用 write0 方 法 将 字符 串 
参数 写 入 文件 ， 这 里 “\n” 代 表 换 行 符 。 关 闭 文 件 之 后 再 次 以 添加 模式 打开 文件 hello.txt， 
调用 write() 方 法 写 入 的 字符 串 “third line.” 被 添加 到 了 文件 末尾 。 最 终 以 读 模式 打开 文件 
后 谈 取 到 的 内 容 共 有 3 行 字 符 串 。 

注意 ，write() 方 法 不 能 目 动 在 字符 串 末尾 添加 换行 和 侍 ， 需 要 用 户 目 己 添 加 “\m”。 

[ 例 ]1-34 完成 一 个 自 定义 函数 copy file0， 实 现 文件 的 复制 功能 。 

copy_file() 函 数 需 要 两 个 参数 ， 指 定 需 要 复制 的 文件 oldfile 和 文件 的 备份 newfile。 分 
别 以 读 模 式 和 写 模式 打开 两 个 文件 ， 从 oldfile 一 次 读 入 50 个 字符 并 写 入 newfile。 当 读 到 
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文件 末尾 时 fileContent=="" 成 立 ， 退 出 循环 并 关闭 两 个 文件 。 
def copy filel(oldfile,newfile): 
oldFile=open (oldfile,™"r") 
newFile=open (newfile,"w") 
whileTrue: 
FileContent oldE rieoreadts0) 
if fileContent=="":  # 读 到 文件 末尾 时 
break 
newFile.write (fileContent) 
oldFile.close() 
newFile.close() 
return 
copy file("D:\\python\\hello.txt","D:\\python\\hello2 .txt") 


@ writelines0 方 法 

Writelines(sequence) 方 法 同文 件 写 入 一 个 序列 字符 串 列表 , 如 果 需 要 换行 则 要 上 自己 加 入 
每 行 的 换行 符 。 

ob]j]=open ("log.txt","w") 

rst2=1 il" test OnelLlor Ad | 

ob] .writelines (11st2) 

ob] .close () 

运行 结果 是 生成 一 个 "log.txt" 文 件 ， 内 容 是 “1ltesthello4455”， 可 见 没有 换行 。 男 外 注 
意 writelines() 方 法 写 入 的 序列 必须 是 字符 串 序 列 ， 整 数 序列 会 产生 错误 。 


1.5.4 文件 内 移动 


无 论 是 读 或 写 文 件 ，Python 都 会 跟踪 文件 中 的 谈 / 写 位 置 。 在 默认 情况 
下 ， 文 件 的 读 / 写 都 是 从 文件 的 开始 位 置 进行 。Python 提供 了 控制 文件 读 / 
写 起 始 位 置 的 方法 ， 使 得 用 户 可 以 改变 文件 读 / 写 操作 发 生 的 位 置 。 

当 使 用 open0O) 函 数 打 开 文 件 时 , open0 〇 函数 在 内 存 中 创建 缓冲 区 , 将 磁盘 上 的 文件 内 容 
复制 到 缓冲 区 。 在 文件 内 容 复 制 到 文件 对 象 缓冲 区 后 ， 文 件 对 象 将 缓冲 区 视 为 一 个 大 的 列 
表 ， 其 中 的 每 一 个 元 素 都 有 目 己 的 索引 ， 文 件 对 象 按 字 节 对 缓冲 区 索引 计数 。 同 时 ， 文 件 
对 象 对 文件 当前 位 置 〈 即 当前 谈 / 写 操作 发 生 的 位 置 ) 进行 维护 ， 如 图 1-23 所 示 。 许 多 方 
法 隐 式 使 用 当前 位 置 。 例 如 在 调用 readline(0 方 法 后 ， 文 件 当前 位 置 移 动 到 下 一 个 回 车 处 。 


文件 缓 神 区 


文件 当前 位 置 


图 1-23 ”文件 当前 位 置 
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Python 使 用 一 些 函 数 跟 踪 文 件 当前 位 置 。tell0 函 数 可 以 计算 文件 当前 位 置 和 开始 位 置 
之 间 的 字 节 偶 移 量 。 

>>> exampleFile=open ("D:\\python\\example.txt","w") 

>>> exampleFile.write("0123456789") 

>>> exampleFile.close() 

>>> exampleFile=open ("D:\\python\\example.txt") 

>>> examplerFile.read (2) 

' Od F 

>>> exampleFile.read (2) 

1231 

>>> examplerFile.tell () 

4 

>>> exampleFile.close() 


这 里 ，exampleFile.tell0) 函 数 返回 的 是 一 个 整数 4， 表示 文件 当前 位 置 和 开始 位 置 之 间 
有 4 个 字 记 仿 移 量 。 因 为 已 经 从 文件 中 读 取 4 个 字符 了 ， 所 以 为 4 个 字 市 偏 移 量 。 

seek0 〇 函数 设置 新 的 文件 当前 位 置 ， 允 许 在 文件 中 跳 转 ， 实 现 对 文件 的 随机 访问 。 

seek( 〇 函数 有 两 个 参数 ， 第 1 个 参数 是 字 市 数 ， 第 2 个 参数 是 引用 点 。seek0 〇 函数 将 文 
件 当前 指针 由 引用 点 移动 指定 的 字 节 数 到 指定 的 位 置 。 其 语法 格式 如 下 : 


seek (offset[,whencel) 


说 明 : offset 是 一 个 字 节 数 ， 表 示 偏 移 量 ， 引 用 点 whence 有 下 面 3 个 取 值 。 

。 文件 开始 处 为 0， 这 也 是 默认 取 值 ， 意 味 看 使 用 该 文件 的 开始 处 作为 基准 位 置 ， 此 
时 字 节 偏 移 量 必须 非 负 。 

。 当前 文件 位 置 为 1， 则 是 使 用 当前 位 置 作为 基准 位 置 ， 此 时 偏 移 量 可 以 取 负 值 。 

。 文件 结尾 处 为 2， 则 该 文件 的 末尾 将 被 作为 基准 位 置 。 


1.5.5 文件 的 关闭 


用 户 应 该 牢记 使 用 close(0 方 法 关闭 文件 .关闭 文件 是 取消 程序 和 文件 之 间 连 接 的 过 程 ， 
内 存 缓冲 区 中 的 所 有 内 容 将 写 入 磁盘 ,因此 必须 在 使 用 文件 后 关闭 文件 确保 信息 不 会 丢失 。 
如 果 要 确保 文件 关闭 ， 可 以 使 用 try/finally 语句 ， 在 finally 子 句 中 调用 close0 方 法 : 


helloFile=open("D:\\python\\hello.txt","w") 
| 

helloFile.write ("Hello,SsSunny Day!") 
finally: 

helloryleseclosetl 


也 可 以 使 用 with 语句 自动 关闭 文件 : 


with open("D:\\python\\hello.txt") as helloFile: 
shnelliorile readl) 
print(s)} 
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with 语句 可 以 打开 文件 并 赋值 给 文件 对 象 ， 之 后 就 可 以 对 文件 进行 操作 了。 文件 会 在 
语句 结束 后 目 动 关闭 ， 即 使 是 由 于 异 第 引起 的 结束 也 是 如 此 。 


1.5.6 ”二 进 制 文件 的 读 / 写 


Python 没有 二 进 制 类 型 ， 但 是 可 以 用 string (字符 串 ) 类 型 来 存储 二 进 制 类 型 数据 ， 
因为 string 是 以 字 节 为 单位 的 。 | 口 

@ 数据 转换 成 字 节 串 

pack(0 方 法 可 以 把 数据 转换 成 字 节 串 〈 以 字 节 为 单位 的 字符 串 )。 

格式 如 下 : 

pack (格式 化 字符 串 ， 数 据 ) 


格式 化 字符 串 中 可 用 的 格式 字符 见 表 1-13 中 的 格式 字符 。 例 如 : 


1mport struct 

a=20 

bytes=struct.pack('1i',a) # 将 a 变 为 字符 串 
print (bytes) 


结果 如 下 : 


bD"\x1IA\xO00\xQO0Nx00° 


此 时 bytes 就 是 一 个 字符 串 , 该 字符 串 按 字 节 和 a 的 二 进 制 存储 内 容 相 同 。 在 结果 中 \x 
是 十 六 进 制 的 意思 ，20 的 十 六 进 制 是 14。 

如 果 是 由 多 个 数据 构成 的 ， 可 以 这 样 : 

a="'hello"' 

b="'world!"' 

C=2 

r= 

bytes=struct .pack ('5s6sif"',a.encode('utf-8'),b.encode("'utf-8"'),c,qd) 


'$s6sif 就 是 格式 化 字符 串 ， 由 数字 加 字符 构成 。 其 中 ，5s 表示 占 5 个 字符 宽度 的 字符 
21 表示 两 个 整数 。 表 1-13 是 可 用 的 格式 字符 及 对 应 C 语言 、Python 语言 中 的 类 型 。 


表 1-13 ”格式 字符 
格式 字符 Python 语言 中 的 类 型 字 
hr | stingoflength] 
Bol | bo 


视频 讲解 


洲 


-| 工 | 二 ||IW|I 和 Ic 
人 | 上 | PP mm- | 二 
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续 表 
格式 字符 字 节 数 
1 lng | inegr | 4 
L usignedlong | mg | 4 
q lnglbng | mg | 。* 

Q usignedlonglong | Img | ;3 
f 4 
d 3 
s 1 
p ha | sg | 1 


vid* | lms | 与 os 有关 
bytes=struct .pack('5Ss6slf',a-encode ('utft-87'),b.-encode ('utf-8') ,cd) 
此 时 的 bytes 就 是 二 进 制 形 陈 的 数据 了 ， 可 以 直接 与 入 文件 。 例 如 : 


binfile=open ("D:\\python\\hellobin.txt", "wbn") 
binfile.write (bytes) 


binfileeclosel) 


人 @ 字 节 串 还 原 成 数据 
unpack(0 方 法 可 以 把 相应 数据 的 字 节 串 《〈 以 字 节 为 单位 的 字符 串 ) 还 原 成 数据 。 
bytes=struct .pack('1I7"，20) # 将 20 变 为 字符 串 


再 进行 反 操 作 ， 现 有 二 进 制 数据 bytes (其 实 就 是 字符 串 )， 将 它 反 过 来 转换 成 Python 


a,=struct .unpack ('1i',bytes) 
注意 ，unpack0O 返 回 的 是 元 组 。 所 以 ， 如 果 只 有 一 个 变量 : 


bytes=struct.pack ('1i"',a) 


那么 解码 的 时 候 需 要 这 样 ; 


3 =atroct nnpackt" DYEesi WE (a J SEroct Unpack(l I Dvtes) 


如 果 直 接 用 a=struct.unpack('i',bytes)， 那 么 a=(20,)， 是 一 个 tuple 而 不 是 原来 的 整数 。 
例如 把 DD 盘 python 文件 夹 下 hellobin.txt 文件 中 的 数据 读 取 并 显示 。 


import struct 
binfile=open ("D:\\python\\hellobin.txt","rb") 
bytes=binfile.read() 
(a,b,c,d)=struct.unpack ('5s6sif"',bytes) 

# 通 过 struct .unpack () 解码 成 Python 变量 
t=struct.unpack('5s6sif"',bytes) 

# 通 过 struct .unpack () 解码 成 元 组 
Drantlt) 
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P 项 目 案例 开发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


读 取 结 来 : 


(DNnello se Db vworildt 27 45-1230D01099863281) 


1.6 Python 的 第 三 方 库 


Python 语言 有 标准 库 和 第 三 方 库 两 类 库 , 标准 库 随 Python 安装 包 一 起 发 布 , 用 户 可 以 
随时 使 用 ， 第 三 方 库 需要 在 安装 后 才能 使 用 。 由 于 Python 语言 经 历 了 数 次 版 本 更 迭 ， 而且 
第 三 方 库 由 全 球 开发 者 分 布 式 维护 ,缺少 统一 的 集中 管理 ,所 以 Python 第 三 方 库 曾 经 一 度 
制约 了 Python 语言 的 普及 和 发 展 。 随 着 官方 pip 工具 的 应 用 ，Python 第 三 方 库 的 安装 变 得 
十 分 容易 。 季 用 Python 第 三 方 库 如 表 1-14。 


表 1-14 常用 Python 第 三 方 库 


库 名 称 库 用 途 
Django 开源 Web 开发 框架 ， 它 鼓励 快速 开发 ， 并 遵循 MVC 设计 ， 比 较 好 用 ， 开 发 周期 短 
webpy 一 个 小 巧 灵 活 的 Web 框架 ， 虽 然 简 单 ， 但 是 功能 强大 
Matplotlib 用 Python 实现 的 类 matlab 的 第 三 方 库 ， 用 于 绘制 一 些 高 质量 的 数学 二 维 图 形 
SciPy 基于 Python 的 matlab 实现 ， 旨 在 实现 matlab 的 所 有 功能 
NumPy 基于 Python 的 科学 计算 第 三 方 库 ， 提 供 了 矩阵、 线性 代数 、 傅 立 叶 变换 等 解决 方案 
PyGtk 基于 Python 的 GUI 程序 开发 GTK+ 库 
PyQt 用 于 Python 的 QT 开发 库 


WxPython Python 下 的 GUI 编程 框架 ， 与 MFC 的 架构 相似 
BeautifulSoup | 基于 Python 的 HTML/XML 解析 器 ， 简 单 易 用 


PIL 基于 Python 的 图 像 处 理 库 ， 功 能 强大 ， 对 图 形 文件 的 格式 支持 广泛 
MySQLdb 用 于 连接 MySQL 数据 库 

Pygame 基于 Python 的 多 媒体 开发 和 游戏 软件 开发 模块 

Py2exe 将 Python 脚本 转换 为 Windows 上 可 以 独立 运行 的 可 执行 程序 

pefile Windows PE 文件 解析 器 


最 利用 且 最 高 效 的 Python 第 三 方 库 的 安装 方式 是 采用 pip 工具 安 疫 。pip 是 Python 官 
方 提供 并 维护 的 在 线 第 三 方 库 安 装 工 具 。 对 于 同时 安装 Python2 和 Python3 环境 为 系统 的 
情况 ， 建 议 采 用 pip3 命令 专门 为 Python3 版 安装 第 三 方 库 。 

例如 安装 Pygame 库 ，pip 工具 默认 从 网 络 上 下 载 Pygame 库 安 装 文 件 并 目 动 装 到 系统 
中 。 注 意 ，pip 是 在 命令 行 下 (cmd) 运行 的 工具 。 

D: \>pip install pygame 

用 尸 也 可 以 凶 载 Pygame 库 ， 邮 载 过 程 可 能 坝 要 用 户 确 认 。 

D: \>pip uninstall pygame 

用 户 还 可 以 通过 list 子 命令 列 出 当前 系统 中 已 经 安装 的 第 三 方 库 ， 例 如 : 

DzN>papr 11ist 

pip 是 Python 第 三 方 库 最 主要 的 安装 方式 , 可 以 安装 超过 90% 以 上 的 第 三 方 库 。 然 而 ， 
由 于 一 些 历 史 、 技 术 等 原因 ， 还 有 一 些 第 三 方 库 暂 时 无 法 用 pip 安装 ， 此 时 需要 用 其 他 的 
安装 方法 (例如 下 载 库 文件 后 手工 安装 )。 
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2.1 猜 单 词 游戏 功能 介绍 


猜 单 词 游戏 就 是 计算 机 随机 产生 一 个 单词 ， 打 乱 字母 顺序 ， 供 玩家 去 
猜 。 此 游戏 采用 控制 字符 界面 ， 运 行 界面 如 图 2-1 所 示 。 


视频 讲解 


迎 参 加 
i 
后 单词 : luebjm 


(Y/ND: y 
词 : oionispt 


Re 
人 

Sx (Y/ND: y 

单词 : tsinoiop 


2-1 猜 单 词 游戏 程序 的 运行 界面 


2.2 ”程序 设计 的 思路 


在 游戏 中 需要 随机 产生 单词 以 及 数字 ， 所 以 引入 random 模块 随机 数 函 数 ， 其 中 
random.choice() 可 以 从 序列 中 随机 选取 元 素 。 例 如 : 


# 创 建 单词 序列 元 组 
WORDS= ("python", "jumble", "easy", "difficult", "answer", "continue", 


"phone"， "position™", “position", "game") 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 拒 虫 、 游 戏 和 机 器 学 习 


# 从 序列 中 随机 挑 出 一 个 单词 


word=random.choice (WORDS) 


word 就 是 从 单词 序列 中 随机 挑 出 一 个 单词 。 
在 游戏 中 随机 挑 出 一 个 单词 word 后 ， 如 何 把 单词 word 的 字母 顺序 打 乱 ? 方法 是 随机 
从 单词 字符 囊 中 选择 一 个 位 置 position, 把 position 位 置 的 那个 字母 加 入 乱 序 后 单词 jumble， 
同时 将 原单 词 word 中 position 位 置 的 那个 字母 删 去 〈 通 过 连接 position 位 置 前 字符 串 和 其 
后 字符 串 实现 )。 通 过 多 次 循 坏 就 可 以 产生 新 的 乱 序 后 单词 jumble。 
while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产 生 word 的 随机 位 置 
position=random.randrange (len (word)) 
# 将 position 位 置 的 字母 组 合 到 乱 序 后 单词 
]umble+=word[Pposition] 
# 通 过 切片 ， 将 position 位 置 的 字母 从 原单 词 中 删除 
word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


2.3 关键 技术 一 一 random 模块 


random 模块 可 以 产生 一 个 随机 数 或 者 从 序列 中 获取 一 个 随机 元 素 , 它 的 常用 方法 和 使 
用 例子 如 下 : 

@ 常用 方法 

] ) random.random!() 


random.random() 用 于 生成 一 个 随机 小 数 n，0<n<1.0。 


import random 


random.random() 

执行 以 上 代码 的 输出 结果 如 下 : 

0.85415370477785668 

2) random.uniform(a, b) 

random.uniform(a, b)， 用 于 生成 一 个 指定 范围 内 的 随机 小 数 ， 两 个 参数 中 一 个 是 上 限 ， 
一 个 是 下 限 。 如 果 a<b， 则 生成 的 随机 数 n 有 a<n<b; 如 果 a>b， 则 b<n<a。 

代码 如 下 : 


import random 
print (random.uniform(10, 20)) 


print (random.uniform(20, 10)) 
执行 以 上 代码 的 输出 结果 如 下 : 


14.2472536006293084 
e3310495673216 
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3) random.randint(a,b) 

random.randint(a,b) 用 于 随机 生成 一 个 指定 范围 内 的 整数 ， 其 中 参数 a 是 下 限 ， 参 数 b 
是 上 限 ， 生 成 的 随机 数 n 有 a<n<b。 

import random 

print (random.randint (12，20))  # 生 成 的 随机 数 n 有 12<n<20 


print (random.randint (20，20) ) # 结 果 永 远 是 20 
#print (random.randint (20，10) ) ## 该 语句 是 错误 的 ， 下 限 必 须 小 于 上 限 


4) Iandom.randrange(|start],stop|,step ]) 

random .randrange([start],stop[,step]) 用 于 从 指定 范围 内 按 指定 基数 递增 的 集合 中 获取 一 
个 随机 数 。 例 如 random.randrange(10,100,2)， 结 果 相 当 于 从 [10,12,14,16,…,96,98] 序 列 中 获 
取 一 个 随机 数 。random.randrange(10,100,2) 在 结果 上 与 random.choice(range(10,100,2)) 
等 效 。 

3) random.choice() 

random.choice() 从 序列 中 获取 一 个 随机 元 素 ， 其 原型 为 random.choice(sequence)， 参 数 
sequence 表示 一 个 有 序 类 型 。 这 里 要 说 明 一 下 , sequence 在 Python 中 不 是 一 种 特定 的 类 型 ， 
而 是 泛 指 序列 数据 结构 。 列 表 、 元 组 、 字 人 符 串 都 属于 sequence。 下 面 是 使 用 random.choice() 


import random 


print (random.choice ("学 习 Python")) # 从 字符 串 中 随机 取 一 个 字符 
print (random.choice (["JGood", "is", "a", "handsome", "boy"])) 
# 从 1ist 列表 中 随机 取 


Drint lrjnum ctioneel li" Tain mL ne # 从 tuple 元 组 中 随机 取 
执行 以 上 代码 的 输出 结果 如 下 : 

= < 

与 

re 

当然 ， 每 次 运行 的 结果 都 不 一 样 。 

6) random.shutffle(x|,random|) 


random.shuffle(x[, random]) 用 于 将 一 个 列表 中 的 元 素 打 乱 ， 例 如 : 


pI”"Python "Is DOwerrul” snplie” “and oo On "|] 


random.shuffle (p) 


print (p) 
执行 以 上 代码 的 输出 结果 如 下 : 
i eo se 1 


在 发 牌 游戏 案例 中 使 用 此 方法 打 乱 牌 的 顺序 实现 洗 牌 功能 。 
7) random.sample(sequence, k) 


random.sample(sequence, k) 用 于 从 指定 序列 中 随机 获取 指定 长 度 的 片段 ，sample(0) 函 数 
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P,. 项 目 案 例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


不 会 


修改 原 有 序列 。 

.ee 

alice random sample(list 5) # 从 List 中 随机 获取 5 个 元 素 作为 一 个 片段 返回 
print (siice) 

ELITE # 原 有 序列 并 没有 改变 


执行 以 上 代码 的 输出 结果 如 下 : 


[32 4 9, 7 
Bp ST 


@ 使 用 举例 
以 下 是 常用 情况 举例 : 
1) 随机 字符 


>>> import random 
>>> random.choice('abcdefg&#%^*f£f") 


其 结果 为 'd'。 
2) 在 多 个 字符 中 选取 特定 数量 的 字符 
>>> import random 


>>>random.sample('abcdefghi]j', 3) 

其 结果 为 ['a，， 'd', 1 

3) 在 多 个 字符 中 选取 特定 数量 的 字符 组 成 新 字符 串 

>>> import random 

> ".Jjoin(random.sample(['a', i ee pi Le ke os i 起 og a 攻 
3) ) .replace (" ee 

其 结 末 为 'ajh'。 

4) 随机 选取 字符 串 


>>> import random 


>>> random.choice(['apple', '‘'pear', '‘'peach', 'orange', 'lemon']) 


其 结果 为 lemon'。 

5) 洗 牌 

>>> import random 

>>> items=[1, 2, 3, 4, 5, 6€] 
>>> Tandom shuffle(items) 
>>> items 


其 结果 为 [3,2,5,6,4,1]。 
6) 随机 选取 0 到 1100 之 则 的 侦 数 


>>> import random 


>>> random.randrange (0, 101, 2) 


第 2 章 序列 应 用 一 一 猿 单词 游戏 | 


其 结果 为 42。 
7) 随机 生成 1 一 100 之 间 的 小 数 


>>> random.uniform(1, 100) 


其 结果 为 5.4221167969800881。 


2.4 ”程序 设计 的 步 又 


猜 单词 洲 戏 程序 的 代码 如 下 : 
# 猜 单词 游戏 


import random 


# 创 建 单词 序列 


WORDS= ("python™ "unble”, "easv”, "difficult”", "answer”, 


"phone", "position", "pose", "game") 
# 开 始 游戏 
Drintl 
欢迎 参加 猜 单 词 游戏 
把 字母 组 合成 一 个 正确 的 单词 


) 

lscontinue="y" 

while iscontinue=="y" or liscontinue=="Y": 
# 从 序列 中 随机 挑 出 一 个 单词 
word=random.choice (WORDS) 
# 一 个 用 于 判断 玩家 是 否 猜 对 的 变量 


EOLPCCE=WOrd 


# 创 建 乱 序 后 单词 

jumble="" 

while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产 生 word 的 随机 位 置 


position=random.randrange (len (word)) 

# 将 position 位 置 的 字母 组 合 到 乱 序 后 单词 

Jumble+=word [position] 

# 通 过 切片 将 position 位 置 的 字母 从 原单 词 中 删除 

word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


guess=input ("\n 请 你 猜 : ") 

while guess!=correct and guess!="": 
print ("对 不 起 不 正确 .") 
guess=input ("继续 猜 : ") 


"eontintder. 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 拒 虫 、 游 戏 和 机 器 学 习 


if guess==correct: 
print (" 真 棒 ， 你 猜 对 了 !") 
iscontinue=input ("\n 是 否 继续 (Y/N):") 
运行 结果 : 
欢迎 参加 猜 单 词 游戏 
把 字母 组 合成 一 个 正确 的 单词 . 
乱 序 后 单词 : yaes 
请 你 猜 : easy 
真 棒 ， 你 猜 对 了 ! 
是 否 继续 (Y/N): y 
乱 序 后 单词 : diufct1fi 
请 你 猜 : difficutl 
对 不 起 不 正确 . 
继续 猜 : difficult 
真 棒 ， 你 猜 对 了 ! 
是 否 继续 (Y/N): n 
> > 


3.1 智力 问答 测试 功能 介绍 


智力 问答 测试 ， 内 容 涉 及 历史 、 经 济 、 风 情 、 民 俗 、 地 理 、 人 文 等 上 古今 中 外 各 方面 的 
知识 ， 让 玩家 在 轻松 娱乐 、 蔓 智 、 摘 和 关 的 同时 不 知 不 沉 地 增长 知识 。 在 答题 过 程 中 对 做 对 、 做 
错 进 行 实 时 跟 踊 ， 测 试 完成 后 能 根据 玩家 的 答题 情况 给 出 成 绩 。 程 序 运 行 界面 如 图 3-1 所 示 。 


3-1 智力 问答 测试 程序 的 运行 界面 


3.2 ” 程 友 设计 的 思路 


程序 使 用 了 一 个 SQLite 试题 库 test2.db， 其 中 每 个 智力 问答 由 题目 、4 个 选项 和 正确 
答案 组 成 (question、Answer A、Answer B、Answer C、Answer D、right Answer)。 在 
测试 前 ， 程 序 从 试题 库 test2.db 读 取 试题 信息 ， 存 储 到 values 列表 中 。 在 测试 时 ， 顺 序 从 
values 列表 读 出 题目 显示 在 GUI 界面 中 供用 户 答 题 。 在 进行 界面 设计 时 ， 智 力 问 答题 目 是 
标签 控件 ，4 个 选项 是 单 选 按 钮 控件 ， 在 “下 一 题 ” 按 钮 单 击 事件 中 实现 题目 切换 和 对 错 
判断 ， 如 果 正 确 则 得 分 score 加 10 分 ， 错 误 不 加 分 ， 并 判断 用 户 是 否 做 完 。 在 “结果 ” 按 
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钮 单 击 事件 中 实现 得 分 score 的 显示 。 


3.3 ”关键 技术 


作为 后 端 数据 库 ， 可 以 制作 有 数据 存储 需求 的 工具 。Python 标准 库 中 的 
SQLite3 提供 该 数据 库 的 接口 。 


从 Python2.5 版 本 以 上 就 内 置 了 SQLite3 ,所 以 在 Python 中 使 用 SQLite 
要 安装 任何 东西 ， 直 接 使 用 。SQLite3 数据 库 使 用 SQL 语言 。SQLite 


视频 讲解 


3.3.1 访问 数据 库 的 步骤 


从 Python2.5 开始 ，SQLite3 就 成 了 Python 的 标准 模块 ， 这 也 是 Python 中 的 唯一 一 个 


数据 库 接口 类 模块 ， 大 大 方便 了 用 户 使 用 Python SQLite 数据 库 开 发 小 型 数据 库 应 用 系统 。 


Python 的 数据 库 模块 有 统一 的 接口 标准 ， 所 以 数据 库 操作 有 统一 的 模式 ， 操 作 数 据 库 


SQLite3 主要 分 为 以 下 几 步 : 


@ 导入 Python SQLite 数据 库 模 块 
Python 标准 库 中 带 有 sqlite3 模块 ， 可 直接 导入 : 


import sqlite3 


全 建立 数据 库 连 接 ， 返 回 Connection 对 象 
使 用 数据 库 模块 的 connect( 〇 函数 建立 数据 库 连 接 ， 返 回 连接 对 象 con。 
con=sqlite3.connect (connectstring) # 连 接 到 数据 库 ， 返 回 sqlite3 .connection 对 象 


说 明 : connectstring 是 连接 字符 串 。 对 于 不 同 的 数据 库 连 接 对 象 ， 其 连接 字符 串 的 格 


式 不 同 ，sqlite 的 连接 字符 串 为 数据 库 的 文件 名 ， 例 如 “Ei:\test.db”。 如 果 指 定 连 接 字 符 串 
为 memory， 则 可 创建 一 个 内 存 数 据 库 。 例 如 : 


= ee 
代 
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import sqlite3 

con=sqlite3.connect ("E:\\test.db") 

如 果 王 盘 下 的 test.db 存在 , 则 打开 数据 库 ; 售 则 在 该 路 径 下 创建 数据 库 test.db 并 打开 。 
@ 创建 游标 对 象 

使 用 游标 对 象 能够 灵活 地 对 从 表 中 检索 出 的 数据 进行 操作 ， 就 本 质 而 言 ， 游 标 实际 上 
种 能 从 包括 多 条 数据 记录 的 结果 集中 每 次 提取 一 条 记录 的 机 制 。 

调用 con.cursor0 创 建 游标 对 象 cur: 

cur=con.cursor () # 创 建 游标 对 象 


@ 使 用 Cursor 对 象 的 execute() 方 法 执行 SQL 命令 返回 结果 集 

调用 cur.execute()、cur.executemany()、cur.executescript(0 方 法 查询 数据 库 。 
e cur.execute(sq])): 执行 SQL 语句 。 

e cur.execute(sql, parameters): 执行 禹 参数 的 SQL 语句 。 
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e cur.executemany(sql, seq of pqrameters): 根据 参数 执行 多 次 SQL 语句 。 

e cur.executescript(sq] script): 执行 SQL 脚本 。 

例如 创建 一 个 表 category。 

CUFT .exXecute ("create table category(id primary key, sort, name)™") 

此 时 将 创建 一 个 包含 3 个 字段 14、sort 和 name 的 表 category。 下 面 回 表 中 插入 记录 : 
cur.execute("insert into category Values (1，1， "computer ' )") 

在 SQL 语句 字符 串 中 可 以 使 用 占 位 符 “?” 表 示 参 数 ， 传 递 的 参数 使 用 元 组 。 例 如 : 
cur.execute ("1Insert Into category values (7? , ?7,?7)", (2, 3, 'literature')) 
@ 获取 游标 的 查询 结果 集 

调用 cur.fetchall()、cur.fetchone()、cur.fetchmany0) 返 回 查询 结果 。 

。 cur.fetchone(): 返回 结果 集 的 下 一 行 (Row 对 象 ); 无 数据 时 返回 None。 

e curfetchall0: 返回 结果 集 的 剩余 行 (了 Row 对 象 列表 )， 无 数据 时 返回 空 List。 

e cur.fetchmany(): 返回 结果 集 的 多 行 〈 了 Row 对 象 列表 )， 无 数据 时 返回 空 List。 
例如 : 


cur.execute("select * from catagory") 


Brinticor FetchalLr)) # 提 取 查 询 到 的 数据 
返回 结果 如 下 : 
Lal TT computler)e (2 2 literature'yl 


如 果 使 用 curfetchone0， 则 首先 返回 列表 中 的 第 1 项 ， 再 次 使 用 ， 返 回 第 2 项 ， 依 次 


用 户 也 可 以 直接 使 用 循环 输出 结果 ， 例 如 : 
for row in cur.execute("select * from catagory"): 


printironl0l romtll) 


@ 数据 库 的 提交 和 回 深 

根据 数据 库 事物 隔离 级 别 的 不 同 ， 可 以 提交 或 回 滚 。 
。 con.commit(): 事务 提交 。 

。 con .TollbackO: 事务 回 深 。 

@ 关闭 Cursor 对 象 和 Connection 对 象 

最 后 需要 关闭 打开 的 Cursor 对 象 和 Connection 对象。 
。 cur.close(): 关闭 Cursor 对 象 。 

。 con.close(): 关闭 Connection 对 象 。 


3.3.2 ”创建 数据 库 和 表 


[ 例 ]3-1 创建 数据 库 sales, 并 在 其 中 创建 表 book, 表 中 包含 3 列 , 即 id、price 和 name， 
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其 中 id 为 主键 (primary key)。 


# 导 入 Python SQLite 数据 库 模块 

import sqlite3 

# 创 建 SQLite 数据 库 

con=sqlite3.connect ("E:\sales .db") 

# 创 建 表 book， 包 含 3 列 ， 即 id (主键 )、price 和 name 


con.execute ("create table book(id primary key, price, name)™") 


说 明 : Connection 对 象 的 execute0 方 法 是 Cursor 对 象 对 应 方法 的 快捷 方式 ， 系 统 会 创 
建 一 个 临时 Cursor 对 象 ， 然 后 调用 对 应 的 方法 ， 并 返回 Cursor 对 象 。 


3.3.3 数据 库 的 插入 、 更 新 和 删除 操作 


在 数据 库 表 中 插入 、 更 新 、 删 除 记录 的 一 般 步 又 如 下 : 

(1) 建立 数据 库 连 接 。 

(2) 创建 游标 对 象 cur， 使 用 cur.execute(sq]) 执 行 SQL 的 insert、update、delete 等 语句 
完成 数据 库 记 录 的 插入 、 更 新 、 删 除 操作 ， 并 根据 返回 值 判断 操作 结 末 。 

(3) 提交 操作 。 

(4) 天 闭 数据库 。 

[ 例 ]3-2 数据 库 表 记录 的 插入 、 更 新 和 删除 操作 。 


import sqlite3 

baoks=1 ("021" 25 大 于 让 下 机 = in022” 3302 大 天 天 天” ("23"7 8 "艺术 殿 可 ") 
( "024",35， "高 级 语言 程序 设计 ") ] 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:N\sales .db") 

# 创 建 游标 对 象 

Cur=Con .cursor() 

# 插 入 一 行 数据 

Cur execinteln"insert einto Doortid pricec namey valuest "D001 33. 大 二 村 下 机 
多 媒体 ' ) ") 

Cur.execute("insert into book(id,price,name) values(?,2?,2?2) "” , ("002",28, 
"数据 库 基础 ") ) 

# 插 入 多 行 数据 

Cur.executemany ("insert into book(id,price,name) values (2?,?,?) ",books) 
# 修 改 一 行 数据 

Cur.execute ("Update book set price=? where name=? ", (25, "大 学 英语 ") ) 

# 删 除 一 行 数据 

n=Cur.execute ("delete from book where price=?", (25,)) 

print ("删除 了 ",n.rowcount, " 行 记 录 ") 

Cons commitrt) 

Cur.closenl) 


Con:closel) 
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运行 结果 如 下 : 
删除 了 2 行 记录 


3.3.4 数据 库 表 的 查询 操作 


但 询 数 据 库 的 步骤 如 下 : 

(1) 建立 数据 库 连 接 。 

(2) 创建 游标 对 象 cur， 使 用 curexecute(sqD 执 行 SQL 的 select 语句 。 
(3) 循环 输出 结果 。 


import sqlite3 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:N\sales .db") 

# 创 建 游标 对 象 

Cur=Con.cursor () 

# 查 询 数 据 库 表 

Cur.execute ("select id,price,name from book") 
FOr Tom nr 


print (row) 
运行 结果 如 下 : 
('001':，33， ' 大 学 计算 机 多 媒体 ' ) 
('002'，28，' 数 据 库 基础 ') 


('023'，18，,，"' 艺 术 欣 赏 ') 
('024'，35，' 高 级 语言 程序 设计 ') 


3.3.5 ”数据 库 使 用 实例 一 一 学 生 通 讯 录 


设计 一 个 学 生 通 讯 录 ， 可 以 添加 、 删 除 、 修 改 里 面 的 信息 。 


import sqlite3 

# 打 开 数 据 库 

def opendb () : 
conn=sqlite3.connect ("E:\mydb.db") 
cur=conn.execute ("create table if not exists tongxinlu (usernum 
integer primary key,username varchar(128), passworld varchar (128), 
address varchar(125), telnum varchar(128))") 
return cur, conn 

# 查 询 全 部 信息 

def showalldb(): 
PTint (" 一 一 一 一 -一 -一 -一 一- 一- 一 一 -一 一 处 理 后 的 数据 --------------- 一 -一 - 
hel=opendb () 


cur=hell[l1l] .cursor () 
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cur.execute("select * from tongxinlu") 
TeS=CUTr .fetchall() 
Torviine mn res: 
for h in line: 
print(hy, 
print 


cur.close() 


# 输 入 信息 
回忆 于 二 了 和 人 


usernum=input ("请 输入 学 号 : ") 
usernamel=input ("请 输入 姓名 : ") 
passworldl1=input ("请 输入 密码 : ") 
address1=input ("请 输入 地 址 : ") 
telnuml=input ("请 输入 联系 电话 : ") 


return usernum,usernamel, passworldl, addressl, telnuml 


# 往 数据 库 中 添加 内 容 
def adddb () : 


SC 欢迎 使 用 添加 数据 功能 ---------------- mm 
print (welcome) 

person=into () 

hel=opendb () 

hel [1] .execute("insert into tongxinlu (usernum,username, passworlgd, 
address, telnum)values (2?,?,?,?,?)", (person[0], person[1], 
person[2], person[3],personl[4])) 

hel [1] .commit () 


# 删 除数 据 库 中 的 内 容 
def deldb(): 


print ("----------------- 恭喜 你 ， 数 据 添加 成 功 ---------------- ") 
showalldb() 

hel[l].close() 

welcome="------------------ 欢迎 使 用 删除 数据 库 功 能 ------------------ " 


print (welcome) 

delchoice=input ("请 输入 想 要 删除 学 号 : ") 

hel=opendb () # 返 回 游标 conn 

hel [1] .execute ("dqelete from tongxinlu where Usernum ="+delchoice) 
he -Comnatr1} 

5001 蕉 喜 你 ， 数 据 删 除 成 功 ---------------- 二 
showalldb() 

hel[ll].close!() 


# 修 改 数 据 库 的 内 容 
def alter() : 


elcome 0 欢迎 使 用 修改 数据 库 功 能 ------------------ " 
print (welcome) 

changechoice=input ("请 输入 想 要 修改 的 学 生 的 学 号 : ") 

hel=opendb () 
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Person=1lInto () 
hel [1] .execute ("update tongxinlu set usernum=?,username=?, 
passworld=?,address=?,telnum=? where usernum="+changechoice, 
(person[0], person[l1l], personl2], person[3],personl4])) 
helilil < comity) 
showalldb() 
hel[ll].close() 
# 碍 询 数据 
def searchdb(): 
WelCOMe="- 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 欢迎 使 用 查询 数据 库 功 能 ----------------- 
print (welcome) 
choice=input ("请 输入 要 查询 的 学 生 的 学 号 : ") 
hel=opendb () 
cur=hell[l1] .cursor () 
cur.execute("select * from tongxinlu where usernum="+choice) 
PeiTzeonmnE 人 
print ("———————————-———- 恭喜 你 ， 你 要 得 找 的 数据 如 下 ------------=-- - 
Fortrowm Ln 
Brint(rom[l0], rowD .ron[l2] ,row[3] .rowl4]1)} 
cursCloset) 
hell[ll].close() 
# 是 否 继 续 
re = Be 0 1h Bt Be = 
choice=inpat ("起 天 维 统 ? (Yy Or n) :") 
if choice=='y": 
a=l1 
else: 
a=0 
return a 
if name ==" main ": 
flag=1 
while flag: 
Welcome="-——-- 一 一 一 一 一 欢迎 使 用 数据 库 通 讯 录 --------=-- 时 
print (welcome) 
cholceshow=""" 
请 选择 您 的 进一步 选择 : 
(添加 ) 往 数据 库 里 面 添 加 内 容 
删除) 删除 数据 库 中 内 容 
(修改 ) 修改 数据 库 的 内 容 
(查询 ) 查询 数据 库 的 内 容 
选择 您 想 要 进行 的 操作 : 
choice=input (choiceshow) 
re eh | [i 
adddb () 
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conti (flag) 
elit choice=—"M 

deldb() 

conti (flag) 
Sl ne "I 

alter() 

conti (flag) 
elif choice==" 查 询 ": 

searchdb() 

conti (flag) 
else: 


print ("你 输入 错误 ， 请 重新 输入 ") 
程序 运行 界面 和 添加 记录 界面 如 图 3-2 所 示 。 


Python 3.5.2 {v3.5.2:d4def2a2901a5, Tun £ Python 3,5.2 (v3.5,2:4def2a2901a5, Jun 25 2016, 22;01:18) [SC 
tel)] on win32 i i Es di "]i 人 ”于 f 
t 
Type ”copyight*， "pp Ee ed SS copyrig “Credits” or lcense or more informatic 
================ RESTART: [YF “Users‘\think ‘Desktop\python\li. py 
>> 
所 卫 站 oben a ee 纯 使 用 ee \ 录 一 一 一 一 一 一 一 一 一 
一 一 一 一 一 一 一 一 一 FL 佣 讯 录 --------- 请 选择 您 的 进一步 选择 
( 瀛 加 ) 往 数据 库 里 和 面 瀛 加 内 容 
0 (出 除 ) 喇 除数 据 亩 中 内 容 
请 选择 您 的 进一步 选择 : 《修改 ?修改 数据 库 的 内 容 
(添加 ) 往 数据 库 里 面 添加 内 容 《 乾 调 走光 者 所 乓 的 内 容 
(删除 ) 量 除 数据 库 中 内 容 本 
( 既 履 ) 怪 必 数据 库 的 内 容 一 欢迎 使 用 添加 数据 功能 
择 您 想 行 的 操作 :F : 
| 


图 3-2 程序 运行 界面 和 添加 记录 界面 


3.4 ”程序 设计 的 步 又 


视频 讲解 


3.4.1 生成 试题 库 


import sqlite3 # 导 入 SQLite 驱动 

# 连 接 到 sQLite 数据 库 ， 数 据 库 文件 是 test .db 

# 如 果 文 件 不 存在 ， 会 自动 在 当前 目录 创建 

conn=sqlite3.connect ('test2 .qdb' ) 

CUrSor=conn .cursor () # 创 建 一 个 Cursor 

#Cursor. Coe SO Se from exam") 

# 执 行 一 条 SQL 语句 ， 创 建 exam 表 

cursor.execute('create table [exam] ([question] varchar (80) null, [Answer Al] 
Varchar (1) null, [Answer B] varchar (1) null, [Answer C] Varchar (1) null, 
[Answer D] varchar (1) null, [right Answer] varchar (1) mu 

# 继 续 执 行 一 条 SQL 语句 ， 插 入 一 条 记录 

cursor.execute("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D, right Answer) values (' 哈雷 起 星 的 平均 周期 为 '，'54 年 '"，'56 年 '，'73 
年 53 年 En) 


cursor.execute ("insert into exam (question, NSuer A AnSmer BD An mre 
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Answer D，right Answer) values(' 夜 郎 目 大 中 “ 夜 郎 ” 指 的 是 现在 哪个 地 方 ? '， "贵州 '， 
' 云 南 '， "广西 '，' 福 建 '，'A')") 

cursor.execute("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D，Tright Answer) values(' 在 中 国 历 史上 是 谁 发 明了 麻药 '，' 孙 思 名 '，' 华 化 '， 
mB) 

cursor.execute("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D，right Answer) values (' 京 剧 中 花旦 是 指 ' ，“' 年 轻 男 子 ' ，“' 年 轻 女子 '，“' 年 长 男子 ' ， 
' 年 长 女子 '，'B')") 

cursor.execute("insert into exam (question, Answer A, Answer B, Answer C, 
Newer Driqht OOSWEF 31026(" 知 球 比 要 全 隐 JLNT A Gr 
cursor.execute("insert into exam (question, Answer A, Answer B, Answer C, 
Answer _D, right _Answer) values ("' 在 天 愿 作 比 辟 鸟 ， 在 地 愿 为 连理 枝 。 讲 述 的 是 谁 的 爱情 故事 ? ' ， 
' 焦 钟 狠 和 刘 兰 芝 ' ，' 梁 山 伯 与 祝 英 台 ' ，“' 崔 萝 葛 和 张 生 ' ，“' 杨 贵妃 和 唐 明星 "， '"D7) ") 


print (cursor .rowcount) # 通 过 rowcount 获得 插入 的 行 数 
CUrsore closel # 关 闭 Cursor 

conn.commit () # 提 交 事 务 

conn .close1() # 关 闭 Connection 


以 上 代码 完成 数据 库 test2.db 的 建立 。 下 面 实现 智力 问答 测试 程序 功能 。 


3.4.2 ” 读 取 试题 信息 


conn=sqlite3.connect ('test2.db') 
CUrSor=conn.cursor () 

# 执 行 查 询 语句 

cursor.execute('select * from exam') 
# 获 得 查询 结果 集 
values=cursor.fetchall () 
cursor.close() 

conn.close() 


以 上 代码 完成 数据 库 test2.db 的 试题 信息 的 读 取 ， 存 储 到 values 列表 中 。 


3.4.3 ”再 面 和 远 辑 设计 


callNextO 用 于 判断 用 户 选择 的 正 误 ， 正 确 则 加 10 分 ， 错 误 不 加 分 : 并 判断 用 户 是 否 


做 完 , 如 果 没 做 完 , 则 将 下 一 题 的 题目 信息 显示 到 timu 标签 ,4 个 选项 显示 到 radiol ~radio4 
这 4 个 单 选 按钮 上 。 


import tkinter 
from tkinter import * 
from tkinter.messagebox import * 


def callNext () : 


global K 

global score 

useranswer=r .get () # 获 取 用 户 的 选择 

print (r.get ()) # 获 取 被 选中 单 选 按钮 变量 值 


TEUNSeEInee gl 
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showinfo (" 恭 嘉 ", "恭喜 你 对 了 ! ") 


scoret+=10 


else: 
showinfo ("遗憾 ", "遗憾 你 错 了 !") 
k=k+1 
i k=1en(valueay: 
showinfo ("提示 ", "题目 做 完了 ") 
return 
# 有 显示 下 一 题 
tm "text"iI=valuesiIkilidol 
raduoll "text" "=valLuesTlEllll 
PaoZl Eee" I vis Ltkehi2l 
下 ER 
radiodl" text TESTEUOesTKENIS] 
二 


def callResult(): 
showinfo ("你 的 得 分 ", str (score)) 


以 下 是 界面 布局 代码 : 


Foob tkinter eT 

root .title('Python 智力 问答 游戏 ') 
root .geometry("S00x200") 
r=tkinter.stringVar () 
r.set('E") 

k=0 

score=0 


# 判 断 用 户 是 否 做 完 


# 题 目 信 息 
#A 选项 
#B 选项 
#C 选项 
#D 选项 


# 创 建 StringVar 对 象 
# 设 置 初 始 值 为 'E'， 初 始 没 选中 


timu=tkinter .Label (root, text=values [k] [0] ) 间 题 目 


timu.pack () 
fl=Frame (root) 
EL Pacel 


# 创 建 第 1 个 Frame 组 件 


radiol=tkinter.Radiobutton (fl1,variable=r,value='A',text=values[k] [1]) 


radiol .pack () 


radio2=tkinter.Radiobutton (fl1,variable=r,value='B',text=values[k] [2]) 


rad1io2 .pack () 


radio3=tkinter.Radiobutton (fl1,variable=r,value='C',text=values[k] [3]) 


radio3 .pack () 


radio4=tkinter.Radiobutton (fl1,variable=r,value='D',text=values[k] [4]) 


radio4.pack() 
f2=Frame (root) 
f2 .pack () 


# 创 建 第 2 个 Frame 组 件 


Buttont(f2, text=" 下 一 十 "comand=caliNext) .packlside=LEET) 
Button (f2,text=" 结 果 ' ;Command=callResult) .pack (side=LEFT) 


root .malnloop () 


4.1 小 小 翻译 器 功能 介绍 


小 小 翻译 器 使 用 百度 翻译 开放 平台 提供 的 API， 实 现 简单 的 翻译 功能 ， 用 户 输入 自己 
需要 翻译 的 单词 或 者 句子 ， 即 可 得 到 翻译 的 结果 ， 运 行 界面 如 图 4-1 所 示 。 该 翻译 器 不 仅 
能 够 将 英文 翻译 成 中 文 ， 也 可 以 将 中 文 翻译 成 英文 ， 或 者 是 其 他 语言 。 


ff 单词 一 译 器 [oe En 
输入 要 副 译 的 内 容 :|[ am a teacher 


番 译 的 结果 : 我 是 个 教员 


| | 


4-1 小 小 翻译 器 的 运行 界面 


4.2 ”程序 设计 的 思路 


百度 翻译 开放 平台 提供 的 API， 可 以 为 用 户 提 供 高 质量 的 翻译 服务 。 通 过 调用 百度 翻 
译 API 编 与 在 线 翻 译 程序 。 

百度 翻译 开放 平台 每 月 提供 200 态 字符 的 免费 翻译 服务 ， 只 要 拥有 百度 账号 并 申请 成 
为 开发 者 就 可 以 获得 所 需要 的 账号 和 密码 。 下 面 是 开发 者 申请 链接 : 


下 ython 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


http://api.fanyi.baidu.com/apl/trans/product/index 

为 方便 使 用 ， 百 度 翻 译 开放 平台 提供 了 详细 的 接 入 文档 ， 链 接 如 下 : 

http://api.fanyi.baidu.com/apl/trans/product/apidoc 

在 相应 文档 中 列 出 了 详细 的 使 用 方法 。 

按照 白 度 翻译 开放 和 平台 文档 中 的 要 求 , 生成 URL 请 求 网 页 ,提交 后 可 返回 JSON 数据 
格式 的 翻译 结果 ， 再 将 得 到 的 JSON 格式 的 翻译 结果 解析 出 来 。 


4.3 ”关键 技术 


4.3.1 urllib 库 简介 视频 讲解 


urllib 是 Python 标准 库 中 最 第 用 的 Python 网 页 访问 的 模块 ， 它 可 以 让 用 户 像 访问 本 地 
文本 文件 一 样 读 取 网 页 的 内 容 。Python2 系列 使 用 的 是 urllib2，Python3 以 后 将 其 全 部 整合 
为 urllib; 在 Python3.x 中 ， 用 户 可 以 使 用 urllib 这 个 库 抓 取 网 页 。 

urllib 库 提供 了 一 个 网 页 访问 的 简单 易 懂 的 API 接口 ， 还 包括 一 些 函 数 方法 ， 用 于 进 
行 参 数 编 码 、 下 载 网 页 等 操作 。 这 个 模块 的 使 用 门槛 非常 低 ， 初 学 者 也 可 以 尝试 去 抓 取 和 
恋 取 或 者 保存 网 页 。urllib 是 一 个 URL 处 理 包 ， 在 这 个 包 中 集合 了 一 些 处 理 URL 的 模块 。 

(1) urllib.request 模块 : 用 来 打开 和 读 取 URL。 

(2) urllib.error 模块 : 包含 一 些 由 urllib.request 产生 的 错误 ， 可 以 使 用 try 进行 捕捉 
处 理 。 

(3) urllib.parse 模块 : 包含 一 些 解 机 URL 的 方法 。 

(4) urllib.robotparser 模块 : 用 来 解析 robots.txt 文本 文件 。 它 提供 了 一 个 单独 的 
RobotFileParser 类 ， 通 过 该 类 提供 的 can fetchg0) 方 法 测试 怜 虫 是 否 可 以 下 载 一 个 页 面 。 


4.3.2 urllib 库 的 基本 使 用 


下 和 面 结合 使 用 urllib.request 和 urllib.parse 两 个 模块 说 明 urllib 库 的 使 用 方法 。 

@ 获取 网 页 信息 

使 用 urllib.request.urlopen() 函 数 可 以 很 轻松 地 打开 一 个 网 站 ， 读 取 并 打印 网 页 信息 。 
urlopen() 函 数 的 语法 格式 如 下 : 


urlopen (url[, datal[, proxies]]) 


urlopen() 返 回 一 个 Response 对 象 , 然后 像 本 地 文件 一 样 操作 这 个 Response 对 象 来 获取 
远程 数据 。 其 中 ， 参 数 url 表示 远程 数据 的 路 径 ， 一 般 是 网 址 ; 参数 data 表示 以 post 方式 
提交 到 URL 的 数据 (提交 数据 有 两 种 方式 一 一 post 与 get, 一 般 情 况 下 很 少 用 到 这 个 参数 ); 
参数 proxies 用 于 设置 代理 。urlopen() 还 有 一 些 可 选 参 数 ， 对 于 具体 信息 ， 读 者 可 以 查阅 
Python 目 这 的 文档 。 
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urlopen() 返 回 的 Response 对 象 提 供 了 如 下 方法 。 

。 read()、readline()、readlines()、fileno()、close(O): 这 些 方法 的 使 用 方式 和 文件 对 象 完 
全 一 样 。 

。 info(): 返回 一 个 httplib.HTTPMessage 对 象 ， 表 示 远 程 服 务 器 返回 的 头 信息 。 

。 getcode(): 返回 HITP 状态 码 。 如 果 是 HITP 请 求 ，200 表示 请 求 成 功 完成 ，404 表 
示 了 网址 未 找到 。 

。 geturl(): 人 返回 请 求 的 URL。 

了 解 了 这 些 ， 读 者 就 可 以 编写 一 个 最 简单 的 息 取 网 页 的 程序 。 


#urllib test01.py 

from urllib import request 

if name ==" main ": 
response=request .urlopen ("http://fanyi.baidu.com") 
html=response.read () 
html=html .decode ("utf-8") #qecode () 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 
print (html) 


urllib 使 用 requesturlopenO 打 开 和 读 取 URL 信息 , 返回 的 对 象 Response 如 同一 个 文本 
对 象 ， 用 户 可 以 调用 read0 进 行 读 取 ， 再 通过 printO 将 读 到 的 信息 打印 出 来 。 
运行 py 程序 文件 ， 输 出 信息 如 图 4-2 所 示 。 


python 3.5.0 She 3 
Ele Edt Shell Debug Options Window Help 


======================== ESTARI: DD: zythony 中 中 -001， by == 一 == 一 == 一 == 一 == 一 == 一 
<!DOCTTPE html >» 


<meta charset= “Wi 3 ”> 

<meta http-equivy=" UA Competible” content=“IE=edge, chrome=1” > 
| ta nm ec < 主 在 线 图 语 百度 各 课 ,同时 

eta nams= eyWor S content= 
pee leapt oi on opto 人 Bh 避风 多 二 入 六 册 译 和 网 页 名 译 服务 支持 中 、 英 、 日 、 韩 、 泰 , 法 、 西 、 
竺 9 站 计 兰 避 学 ， 罗兰 75 
name= renderer” Ce ell lt 
<meta name= force-rendering” content= weblit” > 


<scr 


FR 配置 需要 统计 的 模块， 不 需要 的 模块 不 配置 即 可 【可 点 击 上 面 的 模块 名 称 上 自 动 隐 藏 〉 */ 


Window,. pL 的 抽样 案 【下 面 各 个 揣 的 抽 在 此 基础 上 进行 的 再 抽样 ,hh 协议 的 网 页 必须 配置 ( 需 
下 二 中小 1 . 日 ls 
要 保证 地 害 里 戎 2 技 币 攻 4 ) http 的 可 以 处 配 十” 让 性 十 进行 p 页 需 


produci: 18， /i 希 对 各 5 后 id 
page: 156 1’°, /i 站 中 于 


monkey page: pg 如 果 中 维 贞 ranter 平 台 Ionkey， 刚 为 monkey 的 pageId， 
speed page ”， yy 如 果 te Bh 仁 能 医 控 ， 由 为) ee id Bu i 


J be 1 一 人 人 1 全 上 


图 4-2 读 取 的 百度 翻译 网 页 源码 


其 实 ， 这 就 是 浏览 器 接收 到 的 信息 ， 只 不 过 用 户 在 使 用 浏览 器 的 时 候 ， 浏 览 器 已 经 将 
这 些 信息 转化 成 了 界面 信息 供用 户 浏览 。 浏 览 器 就 是 作为 客户 端 从 服务 器 端 获取 信息 ， 然 
后 将 信息 解析 ， 再 展示 给 用 户 的 。 

这 里 通过 decode() 命 令 将 网 页 的 信息 进行 解码 : 


html=html .decode ("utf-8") 


当然 ， 这 个 前 提 是 用 户 已 经 知 站 了 这 个 网 页 是 使 用 utf-8 编码 的 ,那么 怎么 得 看 网 页 的 
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编码 方式 呢 ?” 非 常 简 单 的 方法 是 使 用 浏览 器 查看 网 页 源码 , 只 需要 找到 head 标签 开始 位 置 
的 chareset， 就 能 知道 网 页 是 采用 何 种 编码 了 。 

需要 说 明 的 是 ，urlopen0 函 数 中 的 url 参数 不 仅 可 以 是 一 个 字符 串 ， 例 如 "http://www. 
baidu.com"， 还 可 以 是 一 个 Request 对 象 ， 这 就 需要 先 定义 一 个 Request 对 象 ， 然 后 将 这 个 
Request 对 象 作 为 urlopen() 的 参数 使 用 ， 方 法 如 下 : 


req=request.Request ("http://fanyi.baidu.com/") #Request 对 象 
response=request .urlopen (Ted) 

html=response -read () 

html=html .decode ("utf-8") 

print (html) 


注意 : 如 果 要 把 对 应 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieve() 函 数 。 


from urllib import request 
request .urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 


riqjdycivqy :Jpgq"r "aaa :Jpg") 


这 样 就 可 以 把 网 络 上 中 原 工学 院 的 图 片 资 源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaa.jpg 
图 片 文件 。 

@ 获取 服务 器 响应 信息 

和 浏览 器 的 交互 过 程 一 样 ，request.urlopenO 代 表 请 求 过 程 ， 它 返回 的 HITPResponse 
对 象 代表 啊 应 。 返 回 内 容 作为 一 个 对 象 更 便于 操作 ，HITPResponse 对 象 的 status 属性 返回 
请 求 HTTP 后 的 状态 ， 在 处 理 数 据 之 前 要 先 判断 状态 情况 。 如 果 请 求 未 被 啊 应 ， 需 要 终止 
内 容 处 理 。reason 属性 非常 重要 ， 可 以 得 到 未 被 啊 应 的 原因 ，url 属性 用 于 返回 页 面 URL。 
HTTPResponse.read() 用 于 获取 请 求 的 页 面 内 容 的 二 进 制 形 式 。 

用 户 也 可 以 使 用 getheaders() 返 回 HTTP 啊 应 的 头 信 息 ， 例 如 : 


from urllib import request 

f=request .urlopen('http://fanyi.baidu.com') 
data=f .read() 

printi'status:" Tt.Statusn ti. reason) 

for k, Vv lin f.getheaders () : 


2 BT 
可 以 看 到 HTTP 响应 的 头 信息 。 


Status 200 OK 

Content-Type: text/html 

Date: Sa > Jul 2Z01L7 02-18-:20 GMT 

EA EE OE SP COR LVAS ENR TNO EON > 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:18:26 GMT; path=/; 
domain= .baidu.com 

Set-Cookle: BAIDUID=2335F4F896262887F5B2BCEAD460F5E9:FG=1; explires=Sun, 
15-Jul-18 02:18:26 GMT; max-age=31536000; path=/; domain=.baidu.com; 
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version=1 
Vary: Accept-Encoding 
Conmectian elose 


Transfer-Encoding: chunked 


同样 可 以 使 用 Response 对 象 的 geturl0 方 法 、info0 方 法 、getcode0) 方 法 获取 相关 的 URL、 
啊 应 信息 和 啊 应 HTTP 状态 码 。 


#-*— coding: UTF-8 一 * 一 

from urllib import request 

if name ==" main ": 
req=request.Request ("http://fanyi.baidu.com/") 
response=request .urlopen (req) 
print ("geturl 打印 信息 : ss"s (response.geturl ())) 


PIlnt ("六 六 米 六 六 米 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 闵 六 闵 六 六 六 六 六 冰冰 ) 


print ("info 打印 信息 : $s"% (response.info())) 
DELn 七 ( ! 米 闵 米 闵 闵 米 米 米 闵 闵 六 六 六 六 六 六 闵 闵 六 六 六 六 米 闵 闵 玉 闵 闵 六 六 六 六 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 冰冰 闵 六!) 


print ("getcode 打印 信息 : $s"% (response.getcode () ) ) 
可 以 得 到 如 下 运行 结果 : 


geturl 打印 信息 : http://fanyi.baidu.com/ 

米 闵 六 六 六 六 闵 六 玉米 闵 六 六 六 六 六 六 六 六 六 六 六 玉米 闵 六 六 六 六 玉米 闵 闵 六 玉米 玉 六 六 玉米 闵 六 六 六 

info 打印 信息 : Content-Type: text/html 

Date: Sat lo Jnl 2017 02:42:32 GMT 

P30 CP OTT PoP COR TVA OUR IND COM 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:42:32 GMT; path=/; 
domain=.balidu.com 

Set-Cookie: BAIDUID=976A41D6BOC3FD6CA816A09BEAC3A89A:FG=1; expires=Sun, 
15-Jul-18 02:42:32 GMT; max-age=31536000; path=/; domain=.baidu.com; 
version=1 

Vary: Accept-Encoding 

Connection: close 


Transfer-Encoding: chunked 
来 求 来 求 来 来 来 来 来 来 求 求 来 来 来 来 来 来 求 求 来 来 水 求 求 来 求 来 玉 求 求 来 求 求 求 来 求 来 求 求 求 来 来 来 来 求 


getcode 打印 信息 : 200 


现在 读者 已 经 学 会 了 使 用 简单 的 语句 对 网 页 进行 抓 取 ， 接 下 来 学 习 如 何 回 服务 器 发 送 

全 向 服务 器 发 送 数据 

用 户 可 以 使 用 urlopen0 函 数 中 的 data 参数 回 服务 器 有 友 送 数据 。 根 据 HTTP 规范 ，get 
用 于 信息 获取 ，post 是 回 服 务 器 提交 数据 的 一 种 请 求 。 换 名 话说， 从 客户 端 回 服务 器 提交 
数据 使 用 post， 从 服务 器 获得 数据 到 客户 端 使 用 get。get 也 可 以 提交 , 与 post 的 区 别 如 下 : 

(1) get 方式 可 以 通过 URL 提交 数据 ， 符 提交 数据 是 URL 的 一 部 分 ; 采用 post 方式 ， 
待 提 交 数 据 放置 在 HIML header 内 。 
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(2) get 方式 提交 的 数据 最 多 不 超过 1024 个 字 节 ,post 没有 对 提交 内 容 的 长 度 做 限制 。 

如 果 没 有 设置 urlopen0 函 数 的 data 参数 ，HTTP 请 求 采用 get 方式 ， 也 就 是 从 服务 器 
获取 信息 ; 如 果 设 置 data 参数 ，HTTP 请 求 采 用 post 方式 ， 也 就 是 回 服务 器 传递 数据 。 

data 参数 有 目 己 的 格式 ， 它 是 一 个 基于 application/x-www.form-urlencoded 的 格式 ， 对 
于 其 具体 格式 ， 读 者 不 用 了 解 ， 因 为 可 以 使 用 urllib.parse.urlencode() 函 数 将 字符 串 目 动 转 
换 成 上 和 面 所 说 的 格式 。 

@@ 使 用 User Agent 隐藏 身份 

1) 为 何 要 设置 User Agent 

有 些 网 站 不 喜欢 被 肘 虫 程序 访问 ， 所 以 会 检测 连接 对 象 ， 如 果 是 爬虫 程序 ， 也 就 是 非 
人 点 击 访问 ， 它 就 会 不 让 继续 访问 ， 所 以 为 了 让 程序 可 以 正 弟 运行 ， 需 要 隐藏 目 己 的 爬虫 
程序 的 喘 份 。 此 时 可 以 通过 设置 User Agent 来 达到 隐藏 身份 的 目的 ，User Agent 的 中 文 名 
为 用 户 人 代理， 简称 UA。 

User Agent 存放 于 headers 中 ， 服 务 器 就 是 通过 查看 headers 中 的 User Agent 来 判断 是 
谁 在 访问 。 在 Python 中 ， 如 果 不 设 置 User Agent， 程序 将 使 用 默认 的 参数 ， 那 么 这 个 User 
Agent 就 会 有 Python 的 字样 ， 如 果 服 务 器 检查 User Agent， 那 么 没有 设置 User Agent 的 
Python 程序 将 无 法 正常 访问 网 站 。 

Python 允许 用 户 修改 这 个 User Agent 来 模拟 浏览 器 访问 ， 它 的 强大 考 良 置疑。 

2) 第 见 的 User Agent 

(1) Android: 


*Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 
(KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19 

Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Bul1d/IMM76D) 
AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 
* 人 Mozilla/5.0 (Linux; U; Android 2.2; en-gb; GT-P1000 Build/FROYO) 
AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 


(2) Firefox: 


Mozillars 0 (Windows NT 6 2: WOWGd4> Fw 21 0 Gecko/20100101. Fyrefox/21 0 
sMozilla/s.0 (Androud;: MODYle: Ty:1A4.0) Gecko/l14.0 Firefox/14.0 


(3) Google Chrome: 


*Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/21 01453.694 59aFarila31.36 

“Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebrKit/ 
535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19 


(4) 10S: 


*Mozilla/5.0 (iPad; CPU OS 5 0 like Mac OS xX) AppleWebKit/534.46 (KHTML, like 
GeEcero) Versaon/ise TMobile/9aA3d4 ‘Safari/ 344.40 3 

Mozilla/5.0 (iPod; U; CPU like Mac OS X7 en) AppleWebKit/420.1 (KHTML, like 
Gecko WETESTOTSS MoODLIIer AL0la Starui/aAlg9e3 
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上 面 列举 了 Android、Firefox、Google Chrome、10OS 的 一 些 User Agent。 

3) 设置 User Agent 的 方法 

设置 User Agent 有 以 下 两 种 方法 : 

(1) 在 创建 Request 对 象 的 时 候 填 入 headers 参数 (包含 User Agent 信息 )， 这 个 
headers 参数 要 求 为 字典 。 

(2) 在 创建 Request 对 象 的 时 候 不 添加 headers 参数 ， 在 创建 完成 之 后 使 用 add_ 
header(0) 方 法 添加 headers。 

使 用 上 面 提 到 的 Android 的 第 1 个 User Agent, 在 创建 Request 对 象 的 时 候 传 入 headers 
参数 ， 编 写 代 人 码 如 下 : 


#-—*— coding: UTF-8 一 * 一 


from urllib import request 


在 


”name ==" main ": 


# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 

HTr1I=" ntpz www-cCsadrmnnetyA 

head=({} 

# 写 入 User Agent 信息 

head['User-Agent']="'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/ 
JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 
Salar ly 


regq=request .Request (url, headers=head) # 创 建 Request 对 象 
response=request .urlopen (red) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ('utf-8') # 读 取 啊 应 信息 并 解码 
print (html) # 打 印信 息 

pA 


使 用 上 面 提 到 的 Android 的 第 1 个 User Agent， 在 创建 Request 对 象 时 不 传 入 headers 
参数 ， 在 创建 之 后 使 用 add_header() 方 法 添加 headers， 编 写 代 码 如 下 : 


#-—*— coding: UTF-8 一 * 一 


from urllib import request 


1f 


”name ==" main ": 


# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 
url="'http://www.csdn.net/' 

req=request .Request (url) # 创 建 Request 对 象 

req.add header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 
7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/ 


i900 1025 512166 SaFari/s3o.19") # 传 入 headers 
response=request .urlopen (req) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ("utf-8°") # 读 取 啊 应 信息 并 解码 

print (html) # 打 印信 息 
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4.4 ”程序 设计 的 步骤 


4.4.1 设计 齐 面 


视频 讲解 


采用 Tkinter 的 place 几何 布局 管理 器 设计 GUI 图 形 界面 ， 运 行 效果 如 图 4-3 所 示 。 


图 4-3 place 几何 布局 管理 右 


新 建文 件 translate_test.py， 编 写 如 下 代码 : 


from tkinter import * 

1f name ==" main ": 
root=Tk () 
root .title ("单词 翻译 器 ") 
root["'width']=250;root['height"]=130 


Label (root, text=' 输 入 要 翻译 的 内 容 : ' ,width=15) .place (x=1, y=1) 


Entryl=Entry (root,width=20) 
Entryl .place (x=110,y=1) 


Label (root, text=' 翻 译 的 结果 : ' ,width=18) .place (x=1,y=20) # 绝 对 坐标 (1，20) 


s=StringVar () 

s.set ("大 家 好 ， 这 是 测试 ") 

Entry2=Entry (root,width=20, textvariable=s) 
Entry2.place (x=110,y=20) 

Buttonl=Button (root, text=' 翻 译 ', width=8) 
Button]l .Place (x=40, y=80) 
Button2=Button (root, text=' 清 空 ', width=8) 
Button2 -Place (x=110,y=80) 

# 给 Button 绑 定 鼠标 监听 事件 

Buttonl .bind("<Button-1>",1leftClick) 
Button2-.bind(™Button 1>" LeftClick2) 
root .mainloop () 


# 绝 对 坐标 (1，1) 
# 绝 对 坐标 (110，1) 


于 个 SEFinavwaEiy 对 全 


# 绝 对 坐标 (110， 20) 
# 绝 对 坐标 (40， 80) 
# 绝 对 坐标 (110， 80) 


#“ 翻 译 ” 按 钮 
#“ 清 空 ”按钮 


4.4.2 ”使 用 百度 翻 详 开放 平台 API 


使 用 百度 翻译 需要 向 “http://api.fanyi.baidu.com/api/trans/vip/translate ”地 址 通过 post 


或 get 方法 发 送 表 4-1 中 的 请 求 参 数 来 访问 服务 。 
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表 4-1 请 求 参数 
参数 名 | 类 型 | 必 填 参数 | 描 述 | 备注 
q TEXT |  Y | 请求 翻 译 query | UTF-8 编码 
ftom | TEXT |  Y | 翻译 源 语言 | 语言 列表 (可 设置 为 auto) 
to TEXT |  Y | 译文 语言 ” | 语言 列表 (不 可 设置 为 auto) 
appid | IT | Y |APPID | 可 在 管理 控制 台 查 看 
jm | TEXT |  Y | 和 |ppdawin 密 机 的 m5 从 
sign 签名 是 为 了 保证 调用 安全 ,使 用 md5 算法 生成 的 一 段 字符 串 ， 生 成 的 签名 长 度 为 
32 位 ， 签 名 中 的 英文 字符 均 为 小 写 格式 。 为 保证 翻译 质量 ， 请 将 单 次 请 求 长 度 控 制 在 6000 
字 节 以 内 《〈 汉 字 约 为 2000 个 )。 
签名 的 生成 方法 如 下 : 
(1) 将 请 求 参数 中 的 appid、query (q， 注 意 为 UTF-8 编码 )、 随 机 数 salt 以 及 平台 分 
配 的 密 钥 〈 可 在 管理 控制 台 查 看 ) 按照 appid+q+salt+ 密 钥 的 顺序 拼接 得 到 字符 串 1。 
(2) 对 字符 串 1 做 md5， 得 到 32 位 小 写 的 sign。 


注意 : 

(1 ) 先 将 需要 翻译 的 文本 转换 为 UTF-8 编码 。 

(2) 在 发 送 HTTP 请 求 之 前 需要 对 各 字段 做 URL encode。 

(3) 在 生成 签名 拼接 字符 串 时 ，q 不 需要 做 URL encode， 在 生成 签名 之 后 发 送 HTTP 
请 求 之 前 才 需 要 对 要 发 送 的 待 翻 译文 本 字段 q 做 URL encode。 


例如 将 apple 从 英文 翻译 成 中 文 。 
请 求 参 数 : 


=apple 


<|<|<|~ 


[ea 
EE 
pr 
: 


mt 


from=en 

to=zh 
appid=2015063000000001 
Salt=1435660288 
平台 分 配 的 密 钥 : 12345678 


生成 签名 参数 sign: 
(1) 拼接 字符 串 1。 


拼接 appid=2015063000000001+q=apple+salt=1435660288+ 密 铀 =12345678 
得 到 字符 串 1=2015063000000001apple143566028812345678 


(2) 计算 签名 sign (对 字符 串 1 做 mds 加 密 ， 注意 在 计算 md5 之 前 ， 字符 串 1 必须 为 
UTF-8 编码 )。 


sign=md5 (2015063000000001apple143566028812345678 ) 
sign=f89f9594663708c1605f3d736d01d2d4 


通过 Python 提供 的 hashlib 模块 中 的 hashlib.md50) 可 以 实现 签名 计算 。 例 如 : 
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import hashlib 
m="201506300000000lapple143566028812345678" 
m MD5=hashlib.md5 (m) 

sign=m MD5 .hexdigest () 

print( ‘m=",m) 


print ('sign=",sign) 


在 得 到 签名 之 后 ， 按 照 百 度 文档 中 的 要 求生 成 URL 请 求 ， 提 交 后 可 返回 翻译 结果 。 

其 完整 请 求 如 下 : 

http://apl.fanyl.baldu.comy/apltrans/vlp/translate2q=apple&from=enwto=zhwappld=201306 
3000000001&salt=1435660288&signf89f9594663708c160Sf3d736d01d2d4 

用 户 也 可 以 使 用 post 方法 传送 需要 的 参数 。 

本 例 采 用 urllib.request.urlopen0 函 数 中 的 data 参数 回 服 务 器 发 送 数 据 。 

下 面 是 发 送 data 的 实例 ， 同 “百度 翻译 ”发 送 要 翻译 数据 data， 得 到 翻译 结果 。 


#-—* 一 coding: UTF-8 —*-— 

from tkinter import * 

from urllib import request 

from urllib import parse 

import json 

import hashlib 

def translate Wordl(en str): 
#simulation browse load host url,get cookie 
URL="'http://api.fanyi.baidu.com/api/trans/vip/translate' 
#en str=input ("请 输入 要 翻译 的 内 容 :") 
# 创 建 Form Data 字典 ， 人 存储 回 服务 器 发 送 的 data 
Form Data=l "From en Lo Zh gq enstr "appd’: 
C20063000000000 Salt 14350G602908 7 
Form Data={} 
Form Datal'from'|="'en"' 
Form Datal[l'to']="'zh" 
Form Datal'q']=en str # 要 翻译 数据 
Form Data['appid']='2015063000000001'  # 申 请 的 APP ID 
Form Datal[l'salt"]="1435660288" 
Key="12345678" # 平 台 分 配 的 密 钥 
m=Form Datal['appid']+en str+Form Data['salt']+Key 
m MD5=hashlib.md5 (m.encode ('utf8°')) 
Form Datal[l'sign']=m MD5.hexdigest () 


data=parse.urlencode (Form Data) .encode ("utf-8°") 


# 使 用 urlencode () 方 法 转换 标准 格式 


response=request .urlopen (URL, data) # 传 递 Request 对 象 和 转换 完 格 式 的 数据 
html=response.read() .decode ('utf-8') # 读 取信 息 并 解码 
translate results=]son.1oads (html) # 使 用 JSON 
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print(ttransiate resultsl # 打 印 出 JSON 数据 
translate results=translate results['trans result"'][0]['dst'"] 

# 找 到 翻译 结果 


print ("翻译 的 结果 是 : ss" % translate results) # 打 印 翻 译 信息 
return translate results 

def leftClick (event): #“ 翻 译 ” 按 钮 事件 函数 
en str=Entryl.get() # 获 取 要 翻译 的 内 容 
print (en str) 
viext=translate Word(en str) 
EnLEV20C0NE1ig (ENtrty2 ext VText) # 修 改 翻 译 结果 框 文字 
Ss set(t ”3 
Entry2.insert (0,vText) 

def leftClick2 (event) : #“ 清 空 ” 按 钮 事件 函数 
SE 
ELEFV2 Insert(0."") 


这 样 就 可 以 合 看 翻译 的 结果 了 ， 如 下 : 


输入 要 翻译 的 内 容 : I am a teacher 
翻译 的 结果 是 : 我 是 个 教师 。 


此 时 得 到 的 JSON 数据 如 下 : 
I Feom ven niEor en Eranstrenle nl dee RT 


'I am a teacher'}]} 


表 4-2 翻译 结果 的 JSON 字段 
字 段 名 类 型 | 描述 
from 翻 详 源 语言 
to 译文 语言 
trans_resulf 翻译 结果 
re 原文 
dst 译文 
trans result 中 包含 了 src 和 dst 字段 。 
JSON 是 一 种 轻 量 级 的 数据 交换 格式 ， 其 中 保存 了 用 户 想 要 的 翻译 结 末 ， 需 要 从 怜 取 
到 的 内 容 中 找到 JSON 格式 的 数据 ， 再 将 得 到 的 JSON 格式 的 翻译 结 末 解析 出 来 。 
这 里 癌 服 务 嚣 发送 数 据 Form_Data 也 可 以 直接 如 下 写 : 
Form Batasl Trom = en to zh gq :en str aa” 
‘22015063000000001 Sa :45000280 1 


现在 只 是 将 类 文 翻译 成 中 文 ， 稍 微 改 一 下 融 可 以 将 中 文 翻译 成 瑞 文 了 : 


Form Datas=T tromn = LEOE en Sense "appid "ss 
20150639000000001 "salt” :0 14356602898 "1 


这 一 行 中 的 from 和 to 的 取 值 应 该 可 以 用 于 其 他 语言 之 间 的 翻译 。 如 果 源 语言 语种 不 
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确定 可 设置 为 auto, 注意 目标 语言 语种 不 可 设置 为 auto。 百度 翻译 ; 


所 示 。 


de 德语 


表 4-3 百度 翻译 支持 的 语言 简写 

于 商 忆 甫 言 贡 本 
a EEC 
是 
ww | Xx ww 
p 
er Wu 
. 一 让 
由 
加 
ES 

ET 


K+ 


持 的 语言 便 写 如 表 4-3 


名 称 
保加利亚 语 
爱沙尼亚 语 
丹麦 语 
芬兰 语 
捷克 语 
罗马 尼 亚 语 
斯 洛 文 尼 亚 语 
瑞典 语 
匈牙利 语 
繁体 中 文 
越南 语 
希腊 语 
荷兰 语 


波兰 语 


请 读者 查阅 资料 编程 ， 回 有 道 翻 译 (http://fanyi.youdao.com/translate?smartresult=dict) 
发 送 要 翻译 数据 data， 得 到 翻译 结果 。 


5.1 校园 网 搜索 引擎 功能 分 析 


随 厦 校 园 网 建设 的 迅速 发 展 ， 校 园 网 内 的 信息 内 容 正 在 以 惊人 的 速度 
增加 看 。 如 何 更 全 面 、 更 准确 地 获取 最 新 、 最 有 效 的 信息 已 经 成 为 人 们 把 握 机 遇 、 迎 接 挑 
战 和 获取 成 功 的 重要 和 条件。 目前 虽然 已 经 有 了 像 Google、 百 度 这 样 优秀 的 通用 搜索 引擎 ， 
但 是 它们 并 不 能 适用 于 所 有 的 情况 和 需要 。 对 学 术 搜 索 、 校 园 网 的 搜索 来 说 ， 一 个 合理 的 
排序 结果 是 非常 重要 的 。 男 外 ， 互 联网 上 的 信息 量 巨 大 ， 远 远 超出 哪怕 是 最 大 的 一 个 搜索 
引擎 可 以 完全 收集 的 能 力 范围 。 本 章 旨 在 使 用 Python 建立 一 个 适合 校园 网 使 用 的 Web 搜 
索引 擎 系统 ， 它 能 在 较 短 的 时 间 内 疏 取 页 面 信 息 ， 具 有 有 效 、 准 确 的 中 文 分 词 功能 ， 能 实 
现 对 校园 网 上 新 闻 信 息 的 快速 检索 展示 。 


5.2 ”校园 网 搜索 引擎 系统 设计 


校园 网 搜索 引擎 一 般 需 要 以 下 几 个 步骤 : 

(1) 网 络 爬 虫 朴 取 这 个 网 站 ， 得 到 所 有 网 页 链接 。 

网 络 爬 虫 就 是 一 只 会 嗅 着 URL (链接 ) 有 息 过 成 千 上 万 个 网 页 ， 并 把 网 页 内 容 搬 到 用 户 
计算 机 上 供用 户 使 用 的 苦力 虫子 。 如 图 5-1 所 示 ， 给 定 爬 虫 的 出 发 页 面 A 的 URL， 它 就 从 
起 始 页 A 出 发 ， 读 取 A 的 所 有 内 容 ， 并 从 中 找到 5 个 URL， 分 别 指向 页 面 B、C、D、E 
和 下， 然后 它 顺 着 链接 依次 抓 取 B、C、D、E 和 下 页面 的 内 容 ， 并 从 中 发 现 新 的 链接 ， 再 
沿 着 链接 息 到 新 的 页 面 ， 对 和 候 虫 带 回来 的 网 页 内 容 分 析 链 接 ， 继 续 扑 到 新 的 页 面 ， 以 此 类 
推 ， 直 到 找 不 到 新 的 链接 或 者 满足 了 人 为 设 定 的 停止 条 件 为 止 。 

至 于 这 只 虫子 前 进 的 方式 ， 则 分 为 广度 优先 搜索 (BFS ) 和 深度 优先 搜索 (DFS)。 在 
这 张 图 中 BFS 的 搜索 顺序 是 A-B-C-D-E-F-G-H-I， 而 深度 优先 搜索 的 顺序 是 遍历 的 路 径 ， 
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BI A-F-G E-H-I BCD。 


图 5-1 网 站 链接 示意 图 


(2) 得 到 网 页 的 源 代码 ， 解 析 剥 离 出 想 要 的 新 闻 内 容 、 标 题 、 作 者 等 信息 。 
(3) 把 所 有 网 页 的 新 闻 内 容 做 成 词 条 索引 ， 一 般 采 用 倒 排 表 索 引 。 
索引 一 般 有 正 排 索引 〈 正 向 索引 ) 和 倒 排 索引 ( 反 向 索引 〉 两 种 类 型 。 
。 正 排 索 引 〈 正 向 索引 ，forward index): 正 排 表 是 以 文档 的 ID 为 关键 字 ， 表 中 记录 
文档 ( 即 网 页 ) 中 每 个 字 或 词 的 位 置信 息 ， 查 找 时 扫描 表 中 每 个 文档 中 字 或 词 的 信 
轧 直 到 找 出 所 有 包含 查询 关键 字 的 文档 。 
正 排 表 的 结构 如 图 5-2 所 示 ， 这 种 组 织 方法 在 建立 索引 的 时 候 结构 比较 简单 ， 建 立 比 
较 方 便 且 易于 维护 ;因为 索引 是 基于 文档 建立 的 ， 若 是 有 新 的 文档 加 入 ， 直 接 为 该 文档 建 
立 一 个 新 的 索引 块 ， 挂 接 在 原来 索引 文件 的 后 面 。 夺 是 有 文档 删除 ， 则 直接 找到 该 文档 号 
文档 对 应 的 索引 信息 ， 将 其 直接 删除 。 但 是 在 查询 的 时 候 需 要 对 所 有 的 文档 进行 扫描 以 确 
保 没 有 遗漏 ， 这 样 就 使 得 检索 时 间 大 大 延长 ， 检 索 效 率 低 下 。 


图 5-2” 正 排 表 结构 示意 图 


尽管 正 排 表 的 工作 原理 非常 简单 ， 但 是 由 于 其 检索 效率 太 低 ， 除 非 在 特定 情况 下 ， 梧 
则 实用 价值 不 大 。 
。 倒 排 索引 《上 反 回 索引 ，inverted index): 倒 排 表 以 字 或 词 为 天 键 字 进行 索引 ， 表 中 关 
键 字 所 对 应 的 记录 表 项 记录 了 出 现 这 个 季 或 词 的 所 有 文档 ， 一 个 表 项 就 是 一 个 字 表 
段 ， 它 记录 该 文档 的 ID 和 字符 在 该 文档 中 出 现 的 位 置 情况 。 
由 于 每 个 字 或 词 对 应 的 文档 数量 在 动态 变化 ， 所 以 倒 排 表 的 建立 和 维护 都 较为 复杂 ， 
但 是 在 得 询 的 时 候 由 于 可 以 一 次 得 到 得 询 关 键 字 所 对 应 的 所 有 文档 ,所 以 效率 高 于 正 排 表 。 
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在 全 文 检索 中 ， 检 过 的 快速 啊 应 是 一 个 最 为 关键 的 性 能 ， 而 索引 的 建立 由 于 在 后 台 进 行 ， 
尽管 效率 相对 低 一 些 ， 但 不 会 影响 整个 搜索 引擎 的 效率 。 
倒 排 表 的 结构 如 图 5-3 所 示 。 


图 5-3” 倒 排 表 结构 示意 图 


正 排 索引 是 从 文档 到 关键 字 的 映射 〈 已 知 文档 求 关键 字 )， 倒 排 索 引 是 从 关键 字 到 文 
档 的 映射 〈 已 知 关键 字 求 文档 )。 

在 搜索 引擎 中 每 个 文件 都 对 应 一 个 文件 ID， 文 件 内 容 被 表示 为 一 系列 关键 词 的 集合 
(实际 上 ， 在 搜索 引擎 索引 库 中 关键 词 已 经 转换 为 关键 词 ID )。 例 如 “文档 1” 经 过 分 词 提 
取 了 20 个 关键 词 , 每 个 关键 词 都 会 记录 它 在 文档 中 的 出 现 次 数 和 出 现 位 置 , 得 到 正 向 索引 
的 结构 如 下 : 


“文档 1” 的 ID > 单词 1: 出 现 次 数 ， 出 现 位 置 列表 ; 单词 2， 出 现 次 数 ， 出 现 位 置 列表 ; …… 
“文档 2” 的 ID > 此 文档 出 现 的 关键 词 列表 


当 用 户 搜索 关键 词 “ 华 为 手机 ”时 ， 假 设 只 存在 正 回 索 引 (〈forward index)， 那 么 就 需 
要 扫 摘 索引 库 中 的 所 有 文档 ， 找 出 所 有 包含 关键 词 “ 华 为 手机 ”的 文档 ， 再 根据 打分 模型 
进行 打分 ， 排 出 名 次 后 呈现 给 用 户 。 因 为 互联 网 上 收录 在 搜索 引擎 中 的 文档 的 数目 是 个 天 
文 数字 ， 这 样 的 索引 结构 根本 无 法 满足 实时 返回 排名 结果 的 要 求 。 所 以 搜索 引擎 会 将 正 回 
索引 重新 构建 为 倒 排 索引 ， 即 把 文件 ID 对 应 到 关键 词 的 映射 转换 为 关键 词 到 文件 ID 的 映 
射 ， 每 个 关键 词 都 对 应 一 系列 的 文件 ， 这 些 文件 中 都 出 现 这 个 关键 词 ， 得 到 倒 排 索引 的 结 
构 如 下 : 

“单词 1”: “文档 1” 的 ID,“ 文 档 2” 的 ID，……… 

“单词 2”， 带 有 此 关键 词 的 文档 ID 列表 


(4) 搜索 时 ， 根 据 搜索 词 在 词 条 索引 中 伍 询 ， 按 顺序 返回 相关 的 搜索 结果 ， 也 可 以 按 
网 页 评价 排名 顺序 返回 相关 的 搜索 结果 。 

当 用 户 输入 一 串 搜 索 字 符 串 时 ， 程 序 会 先进 行 分 词 ， 然 后 依照 每 个 词 的 索引 找到 相应 
网 页 。 假 如 在 搜索 框 中 输入 “从 前 有 座 山 山里 有 座 庙 小 和 尚 ”， 搜索 引擎 首先 会 对 字符 串 进 
行 分 词 处 理 “ 从 前 /有 / 座 山 /山里 /有 / 座 庙 /小 和 疝 ”， 然 后 按照 一 定 的 规则 对 词 做 布尔 运算 ， 
例如 每 个 词 之 间 做 “与 ”运算 ， 在 索引 中 搜索 “同时 ”包含 这 些 词 的 页 面 。 

所 以 本 系统 主要 由 以 下 4 个 模块 组 成 。 

。 信息 采集 模块 : 主要 是 利用 网 络 爬 虫 实现 对 校园 网 信息 的 抓 取 。 

。 系 引 模块 : 负责 对 爬 取 的 新 闻 网 页 的 标题 、 内 容 和 作者 进行 分 词 并 建立 倒 排 词 表 。 
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。 网 页 排名 模块 ; TF/IDF 是 一 种 统计 方法 , 用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语 
料 库 中 的 一 份 文件 的 重要 程度 。 
。 用 户 搜 索 界 面 模块 : 负责 用 户 关 键 字 的 输入 以 及 搜索 结果 信息 的 返回 。 


5.3 关键 技术 


5.3.1 正则 表达 式 


把 网 页 中 的 超 链接 提取 出 来 需要 使 用 正则 表达 式 。 那 么 什么 是 正则 表达 式 ? 在 回答 这 
个 问题 之 前 先 来 看 一 看 为 什么 要 有 正则 表达 式 。 

在 编程 处 理 文本 的 过 程 中 ， 经 常 需 要 按照 某 种 规则 去 查找 一 些 特定 的 字符 串 。 例 如 知 
道 一 个 网 页 上 的 图 片 都 叫 “image/8554278135.jpg” 之 类 的 名 字 ， 只 是 那 串 数字 不 一 样 ， 叉 
或 者 在 一 堆 人 员 的 电子 档案 中 ， 要 把 他 们 的 电话 号 码 全 部 找 出 来 ， 整 理 成 通讯 录 。 诸 如 此 
类 工作 ， 可 不 可 以 利用 这 些 规律 ， 让 程序 目 动 来 做 这 些 事情 ? 管 案 是 肯定 的 。 这 时 候 就 需 
要 一 种 描述 这 些 规 律 的 方法 ， 正 则 表达 式 就 是 摘 述 文本 规则 的 代码 。 

正则 表达 式 是 一 种 用 来 匹配 字符 串 文 本 的 强 有 力 的 武器 。 它 是 用 一 种 描述 性 的 语言 来 
给 字符 串 定义 一 个 规则 。 凡 是 符合 规则 的 字符 串 ， 就 认为 它 “[ 逻 配 ” 了 ， 盏 则 该 字符 串 束 
是 不 合法 的 。 

@ 正则 表达 式 的 语法 

正则 表达 式 并 不 是 Python 中 特有 的 功能 ,， 它 是 一 种 通用 的 方法 ， 要 使 用 它 必须 会 用 正 
则 表达 式 来 摘 述 文本 规则 。 

正则 表达 式 使 用 特殊 的 语法 来 表示 ， 表 5-1 列 出 了 正则 表达 式 的 语法 。 

表 5-1 正则 表达 式 的 语法 


模式 描述 
人 匹配 字符 串 的 开头 
匹配 字符 串 的 末尾 


匹配 任意 字符 ， 除 了 换行 符 
| 用 来 表示 一 组 字符 ， 例 如 [amk] 匹 配 'a'、'm' 或 改 ，[0-9] 匹 配 任 何 数字 ， 类 似 于 
站 [0123456789]; [a-z] 匹 配 任何 小 写字 母 ，[a-zA-Z0-9] 匹 配 任何 字母 及 数字 
[A 不 在 中 中 的 字符 ， 例 如 [^abc] 匹 配 除了 a、b、c 之 外 的 字符 ;[^0-9] 匹 配 除了 数字 之 
外 的 字符 


数量 词 ， 匹 配 0 个 或 多 个 

数量 词 ， 匹 配 1 个 或 多 个 

? 数量 词 ， 以 非 贫 禁 方式 匹配 0 个 或 1 个 

{n,} 重复 n 次 或 更 多 次 

{ n,m} 重复 n 一 m 次 

alb 匹配 a 或 bb 

(re) 匹配 括号 内 的 表达 式 ， 也 表示 一 个 组 

(?imx) 正则 表达 式 包含 3 种 可 选 标志 ， 即 1、m、x， 只 影 啊 括 号 中 的 区 域 
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续 表 
模 式 描 述 
(?-imx) 正则 表达 式 关 闭 1、m 或 x 可 选 标志 ， 只 影 啊 括号 中 的 区 域 
(?: re) 类 似 (...)， 但 是 不 表示 一 个 组 


(7?imx: re) 在 括号 中 使 用 1、m 或 x 可 选 标志 
(?-imx: Te) 在 括号 中 不 使 用 1、m 或 x 可 选 标志 
前 问 肯 定 界 定 符 ， 如 果 所 含 正 则 表达 式 以 ... 表 示 ， 在 当前 位 置 成 功 匹 配 时 成 功 ， 否 


(?= re) 则 人 失败。 一 旦 所 含 表 达 式 已 经 尝试 ， 匹配 引擎 根本 没有 提高 ,模式 的 剩余 部 分 还 要 
妾 试 界 定 从 的 右边 
前 问 否 定 界定 符 , 与 前 面 肯 定 界 定 和 从 相反 ， 当 所 含 表 达 式 不 能 在 字符 串 当 前 位 置 下 
(?! re) 、 
配 时 成 功 
(?> re) 匹配 的 独立 模式 ， 省 去 回溯 
\w 匹配 字母 、 数 字 及 下 男 线 ， 等 价 于 '[A-Za-z0-9 】 
\W 匹配 非 字母 、 数 字 及 下 男 线 ， 等 价 于 '[^A-Za-z0-9_1 
\s 匹配 任何 空白 字符 ， 包 括 空 格 、 制 表 答 、 换 页 符 等 ， 等 价 于 [ \fn\nt\Ww] 
\S 匹配 任何 非 空白 字符 ， 等 价 于 [^\fn\tw] 
\d 匹配 任意 数字 ， 等 价 于 [0-9] 
\D 匹配 任意 非 数 字 ， 等 价 于 [^0-9] 
\A 匹配 字符 串 开 始 
\Z 匹配 字符 串 结束 ， 如 果 存 在 换行 ， 只 匹配 到 换行 前 的 结束 字符 串 
匹配 字符 串 结束 
\G 匹配 最 后 匹配 完成 的 位 置 


匹配 一 个 单词 边界 ， 也 就 是 单词 和 空格 间 的 位 置 。 例 如 ，'erb' 可 以 匹配 "never" 中 的 


轩 'er'"， 但 不 能 匹配 "verb" 中 的 'er' 
B 匹配 非 单 词 边 界 ， 例 如 'en\B' 能 匹配 "verb" 中 的 'er， 但 不 能 匹配 "never" 中 的 'er 
mn、\t 等 匹配 一 个 换行 符 、 一 个 制 表 符 等 


正则 表达 式 通 常用 于 在 文本 中 查找 匹配 的 字符 串 。 在 Python 中 数量 词 默认 是 贫 郴 的 ， 
总 是 答 试 死 配 尽 可 能 多 的 字符 ; 非 贫 禁 的 则 相反 ， 总 是 答 试 匹配 尽 可 能 少 的 字符 。 例 如 ， 
正则 表达 式 "ab*" 如 果 用 于 查找 "abbbc"， 将 找到 "abbb"; 如 果 使 用 非 贷 禁 的 数量 词 "ab*?"， 
将 找到 "a"。 

在 正则 表达 式 中 ， 如 果 直 接 给 出 字符 ， 就 是 精确 匹配 。 从 正则 表达 式 语 法 中 能 够 了 解 
到 用 \d 可 以 匹配 一 个 数字 ， 用 \w 可 以 匹配 一 个 字母 或 数字 ， 用 .可 以 匹配 任意 字符 ， 所 以 模 
式 '00\d 可 以 匹配 '007， 但 无 法 匹配 '00A'; 模式 \d\d\d' 可 以 匹配 '010'"， 模 式 \wWww\d' 可 以 匹配 
'py3';， 模式 'py.' 可 以 匹配 'pyc'、'pyo'、'py!'， 等 等 。 

如 果 要 [匹配 变 长 的 字符 , 在 正则 表达 式 模式 字符 串 中 用 * 表 示 任 意 个 字符 (包括 0 个)， 
用 + 表示 至少 一 个 字符 ， 用 ?表示 0 个 或 1 个 字符 ,用 织 } 表 示 n 个 字符 , 用 {n,m} 表 示 n~m 
个 字符 。 这 里 看 一 个 复杂 的 表示 电话 号 码 的 例子 ， 即 \d{3}Ns+\d{3,8} 。 

\d{3} 表 示 [ 匹 配 3 个 数字 ， 例 如 '010'; 

\s 可 以 匹配 一 个 空格 (也 包括 Tab 等 空白 符 )， 有 所 以 \s+ 表 示人 至 少 有 一 个 空格 ; 

\d{3,8} 表 示 3 一 8 个 数字 ， 例 如 '67665230'。 

综合 起 来 ， 上 面 的 正则 表达 式 可 以 匹配 以 任意 个 空格 隔 开 的 市 区 号 的 电话 号 码 。 
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如 果 要 匹配 '010-67665230' 这 样 的 号 码 ， 怎 么 办 ? 由 于 '-' 是 特殊 字符 ， 在 正则 表达 式 中 
要 用 \' 转 义 ， 所 以 上 面 的 正则 表达 式 是 \d{3}\-\d{3,8}。 

如 果 要 做 更 精确 的 匹配 ， 可 以 用 [] 表 示范 围 ， 例 如 : 

[0-9a-zA- 妈 _] 可 以 匹配 一 个 数字 、 了 字母 或 者 下 辆 线 ; 

[0-9a-zA-Z\_]+ 可 以 匹配 至 少 由 一 个 数字 、 字 母 或 者 下 辆 线 组 成 的 字符 串 ， 例 如 'a100'、 
'0 Z'、'Py3000' 等 ; 

[a-zA-_][0-9a-zA-Z\ ]* 可 以 匹配 以 字母 或 下 男 线 开头 ， 后 接任 意 个 由 一 个 数字 、 字 
母 或 者 下 辆 线 组 成 的 字符 串 ， 也 就 是 Python 合法 的 变量 ; 

[a-zA-Z\_][0-9a-zA-Z\ ]{0, 19} 更 精确 地 限制 了 变量 的 长 度 是 1 一 20 个 字符 (前 面 1 个 
字符 + 后 面 最 多 19 个 字符 )。 

另外 ，AIB 可 以 匹配 A 或 B， 所 以 PIp)ython 可 以 匹配 "Python' 或 者 python'。 

^ 表 示 行 的 开头 ，Ad 表示 必须 以 数字 开头 。 

$ 表 示 行 的 结束 ，\d$ 表 示 必 须 以 数字 结束 。 

@ re 模块 

Python 提供 了 re 模块， 包含 所 有 正则 表达 式 的 功能 。 

1) match() 方 法 

re.match() 的 格式 为 re.match(pattern, string, flags)。 

其 第 1 个 参数 是 正则 表达 式 , 第 2 个 参数 表示 要 匹配 的 字符 串 ; 第 3 个 参数 是 标志 位 ， 
用 于 控制 正则 表达 式 的 匹配 方式 ， 例 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 

match() 方 法 判断 是 人 否 匹 配 ， 如 果 匹 配 成 功 ， 返 回 一 个 Match 对 象 ， 人 否则 返回 None。 
弟 见 的 判断 方法 如 下 : 

test=' 用 户 输入 的 字符 串 ' 

IF TC-natehn(rr 丰 攻守 玉 贡 "testy: #r 前 组 为 原 义 字符 串 ， 它 表示 对 字符 串 不 进行 转 义 

Briamtl or 
else: 
print ('failed') 

例如 : 

>>> import re 

>>> re.match(r'^\d{31\-\d{3,8}$'，, '010-12345') 返回 一 个 Match 对 象 

< Sre.SRE Match object; span=(0,9), match="'010-12345'> 

DRT mL WoT A or Dl2345°1 

#'010 12345' 不 匹配 规则 ， 返 回 None 


Match 对 象 是 一 次 匹配 的 结果 ， 包 含 了 很 多 关于 此 次 匹配 的 信息 ， 可 以 使 用 Match 提 
供 的 可 读 属性 或 方法 来 获取 这 些 信息 。 

Match 属性 如 下 : 

。 string: 匹配 时 使 用 的 文本 。 

。 re: 匹配 时 使 用 的 Pattern 对 象 。 

。 pos: 文本 中 正则 表达 式 开 始 搜索 的 索引 ，, 值 与 Pattern.matchO0 和 Pattern.search() 方 法 
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的 同名 参数 相同 。 

endpos: 文本 中 正则 表达 式 结 束 搜索 的 索引 ， 值 与 Pattern.match() 和 Pattern.search() 

方法 的 同名 参数 相同 。 

lastindex: 最 后 一 个 被 捕获 的 分 组 在 文本 中 的 索引 。 如 果 没 有 被 捕获 的 分 组 ， 将 为 

None。 

lastgroup: 最 后 一 个 被 捕获 的 分 组 的 别名 。 如 果 这 个 分 组 没有 别名 或 者 没有 被 捕获 

的 分 组 ， 将 为 None。 

Match 方法 如 下 : 

。 group([group1, ...]): 获得 一 个 或 多 个 分 组 截获 的 字符 串 ， 当 指定 多 个 参数 时 将 以 元 
组 形式 返回 。 参 数 group1 可 以 使 用 编号 也 可 以 使 用 别名 ; 编号 0 代表 整个 匹配 的 子 
串 ; 当 不 填写 参数 时 返回 group(0); 没有 截获 字符 串 的 组 返回 None; 截获 了 多 次 的 
组 返回 最 后 一 次 截获 的 子 串 。 

。 groups([default]): 以 元 组 形式 返回 全 部 分 组 截获 的 字符 串 , 相当 于 调用 group(1,2,…， 
last)。default 表示 没有 截获 字符 串 的 组 以 这 个 值 蔡 代 ， 默 认为 None。 

。 groupdict([default]): 返回 以 有 别名 的 组 的 别名 为 键 、 以 该 组 截获 的 子 串 为 值 的 字典 ， 
没有 别名 的 组 不 包含 在 内 。default 的 含义 同上 。 

。 start([group]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 起 始 索 引 〈( 子 串 第 1 个 字符 的 
索引 )。group 的 默认 值 为 0。 

e end([sroup]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 结束 索引 〈( 子 串 最 后 一 个 字符 
的 索引 +1 )。group 的 默认 值 为 0。 

。 span([group]): 返回 (start(group), end(group))。 

Match 对 象 的 相关 属性 和 方法 示例 如 下 : 

import re 

t="19:05:25" 

m=re.match(r'^(\d\d)\:(\d\d)\: (\d\d)s$', t) #r 原 义 


ET "mString: 0m otrindg) 4m etringq TS 

print (nmn- re) trev Gomilel ea Ona Na Ln) 
printi"m po ”mp0s) mm pos “0 

print ("m.endpos:", m.endpos) #m.endpos: 8 

print ("m.lastindex:", m.lastindex) #0 Iastindex- 3 

Print ("m.lastgroup:", m.lastgroup) #m.1lastgroup: None 

PEIint(t morounpt0) "mogroupl0)) Fm roO0nt0) -1905 2 
BFEIEI OIL 2 OOUDT 2 RON 二 JR 19 00 05") 
print(t marounsi(i): "mqroupst)) mn 
print("mgroupdietiys™" mgroumpdicttl)) dm Groupgdictly= 1} 
Erintl"m etart (2 matartli2y) mstarel2) 3 

prant( mendi2)=" Sm end(2}) #m.end(2): 5 

printtlm span(t2) "mspan(2)) Fm pant(t2) 43.73) 

关于 分 组 的 内 容 见 后 面 。 
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PP, 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


2) 分 组 

除了 简单 地 判断 是 否 匹 配 之 外 ， 正 则 表达 式 还 有 提取 子 串 的 强大 功能 ， 用 0 表示 的 就 
是 要 提取 的 分 组 。 例 如 ^Q\d{3})-Qd{3,8})$ 分 别 定 义 了 两 个 组 ， 可 以 直接 从 [匹配 的 字符 串 中 
提取 出 区 号 和 本 地 号 码 : 


S00 Lomtele lS GT HL0 .2533491 


>>> mgroup0} 4 "010=12345" 
>>> m.group (1) 010" 
> mqroup(2)} 0 


如 果 正 则 表达 式 中 定义 了 组 ,就 可 以 在 Match 对 象 上 用 group0 方 法 提取 出 子 串 。 注意 
group(0) 永 远 是 原始 字符 串 ，group(1)、group(2) 表 示 第 1、2 个 子 串 。 

3) 切 分 字符 串 

用 正则 表达 式 切 分 字符 串 比 用 固定 的 字符 更 灵活 ， 请 看 普通 字符 串 的 切 分 代码 : 

SH ei #split (，') 表 示 按 空格 分 隔 

Be i a we Sl 

其 结果 是 无 法 识别 连续 的 空格 , 可 以 使 用 re.split(0 方 法 来 分 割 字 符 串 ,例如 re.split(r\s+', 
text) 将 字符 串 按 空格 分 割 成 一 个 单词 列表 : 

> > 7 # 用 正则 表达 式 

[ = | ' ey ' ' We T ] 

无 论 多 少 个 空格 都 可 以 正常 分 割 。 

再 例如 分 隔 符 既 有 空格 又 有 去 号 、 分 号 的 情况 : 

ES6TaE 位 NS I rab er # 可 以 识别 空格 、 

a i i | 

>>> re.split(r'[\s\yj\;7]+'，'asb;; Cc d')  # 可 以 识别 空格 、 豆 号、 分 号 

B= Be Se eo 

4) search() 和 findall0 方 法 

re.match(O 总 是 从 字符 串 “ 开 头 ” 去 匹配 ， 并 返回 匹配 的 字符 串 的 Match 对 象 ， 所 以 当 
用 re.match() 去 匹配 非 “ 开 涉 ” 部 分 的 字符 串 时 会 返回 None。 

strl="Hello World!" 

print (re.match (r'World',str]l)) # 结 果 为 None 

如 果 想 在 字符 串 中 的 任意 位 置 去 匹配 ， 请 用 re.search() 或 re.findall()。 

re.search() 将 对 整个 字符 串 进行 搜索 ， 并 返回 第 1 个 匹配 的 字符 串 的 Match 对 象 。 


strl="'Hello Wor1ldl 
print (re.search(r'World',str]l)) 


输出 结果 如 下 : 
SI re SRE Maech object; span=(6,11), match="'World'> 


re.findallO 国 数 将 返回 一 个 所 有 匹配 的 字符 串 的 字符 串 列 表 。 例 如 : 


i 
di 
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strl="'Hi, I am Shirley Hilton. I am his wife.' 


>>> printlresearchir hi striy) 

以 上 代码 的 输出 结果 如 下 : 

< sre.SRE Match object; span=(10, 12), match="'hi'> 
此 时 应 用 re.findall0) 函 数 : 


Sl 


输出 结果 如 下 : 
Bd Ye IE 


这 两 个 “hi” 分 别 来 自 “Shirley” 和 “his”。 在 默认 情况 下 正则 表达 式 是 严格 区 分 大 小 
写 的 ， 所 以 “于 ”和 “Hilton” 中 的 “于 ”被 忽略 了 。 

如 果 只 想 找 到 “hi” 这 个 单词 ， 而 不 把 包含 它 的 单词 计算 在 内 ， 那 就 可 以 使 用 “\bhi\b” 
这 个 正则 表达 式 。“\b” 在 正则 表达 式 中 表示 单词 的 开头 或 结尾 ， 空 格 、 标 点 、 换 行 都 算是 
单词 的 分 割 ， 而 “\b” 目 映 又 不 会 匹配 任何 字符 ， 它 代表 的 只 是 一 个 位 置 ， 所 以 单词 前 后 
的 空格 、 标 点 之 类 不 会 出 现在 结果 中 。 

在 前 面 的 例子 中 ,“\bhivb ”匹配 不 到 任何 结束， 因为 没有 单词 mi (于 ” 不 是 ， 严 格 区 
分 大 小 写 )。 但 如 条 是 “\bhi”， 融 可 以 匹配 到 1 个 “hi”， 出 目 “his”。 


5.3.2 ”中 文 分 词 


在 英文 中 ， 单 词 之 间 是 以 空格 作为 目 然 分 界 符 的 ;而 中 文 只 是 句子 和 段 可 以 通过 明显 
的 分 界 符 来 简单 划分 ， 唯 独 词 没 有 一 个 形式 上 的 分 界 符 ， 虽 然 也 同样 存在 短语 之 间 的 划分 
问题 ， 但 是 在 词 这 一 层 上 ， 中 文 要 比 喘 文 复 杂 得 多 。 

中 文 分 词 就 是 将 连续 的 字 序 列 按照 一 定 的 规范 重新 组 合成 词 序 列 的 过 程 。 中 文 分 词 是 
网 页 分 析 索 引 的 基础 。 分 词 的 准确 性 对 搜索 引擎 来 说 十 分 重要 ， 如 果 分 词 速度 太 慢 ， 即 使 
再 准确 ， 对 于 搜索 引擎 来 说 也 是 不 可 用 的 ， 因 为 搜索 引擎 需要 处 理 很 多 网 页 ， 如 果 分 析 消 
耗 的 时 间 过 长 ， 会 严重 影响 搜索 引擎 内 容 更 新 的 速度 。 因 此 ， 搜 索引 擎 对 于 分 词 的 准确 率 
和 速率 都 提出 了 很 高 的 要 求 。 

jieba 是 一 个 文 持 中 文 分 词 、 局 准确 率 、 遍 效率 的 Python 中 文 分 词组 件 ， 它 文 持 综 体 
分 词 和 目 定 义 词典 ， 并 文 持 3 种 分 词 模式 。 

(1) 精确 模式 : 试图 将 句子 最 精确 地 切 开 ， 适 合 文本 分 析 。 

(2) 全 模式 : 把 句子 中 所 有 可 以 成 词 的 词语 都 扫描 出 来 ， 速 度 非 常 快 ， 但 是 不 能 解决 
上 收 义 的 问题 。 

(3) 搜索 引擎 模式 : 在 精确 模式 的 基础 上 对 长 词 骨 次 切 分 ， 提 高 召回 率 ， 适 合用 于 搜 
索引 擎 分 词 。 


5.3.3 安 效 和 使 用 jieba 
在 命令 行 中 输入 以 下 代码 : 
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2 项 目 案 例 开 发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


pip install JjJieba 
如 果 出 现 以 下 提示 则 安 半 成功 。 


Installing collected packages: Jieba 
Running setup.py install for JjJieba ... done 
Successfully installed jieba-0.38 


组 件 提 供 了 jieba.cut0 方 法 用 于 分 词 ，cut(0) 方 法 接受 两 个 输入 参数 : 

(1) 第 1 个 参数 为 需要 分 词 的 字符 串 。 

(2) cut all 参数 用 来 控制 分 词 模式 。 

jieba.cutO 返 回 的 结构 是 一 个 可 迭代 的 生成 器 〈generator)， 可 以 使 用 for 循环 来 获得 分 
词 后 得 到 的 每 一 个 词语 ， 也 可 以 用 listQieba.cut(...)) 转 化 为 list 列表 。 例 如 : 

import jieba 

seg_1ist=jieba.cut ("我 来 到 北京 清华 大 学 "，cut _ all=True) # 全 模式 

Drint("Full Modes "eo "I " on(seg List)) 

seg 1ist=jieba.cut ("我 来 到 北京 清华 大 学 ") “# 默 认 是 精确 模式 ， 或 者 cut all =False 

print (type (seg 11st) ) #<class '‘'generator'> 

print ("Default Mode:", '/'.Join(seg list)) 

seg list=jieba.cut for search ("我 来 到 北京 清华 大 学 ") 搜索 引擎 模式 

print ("搜索 引擎 模式 :"，'/' .join(seg 1List) ) 

seg 1ist=jieba.cut ("我 来 到 北京 清华 大 学 ") 

for word in seg list: 


print (word, end=" ') 
运行 结果 如 下 : 


Building prefix dict from the default dictionary ... 
Loading model from cache C:\Users\ADMINI~1\AppData\Local\Temp\Jieba.cache 
Loading model cost 1.648 seconds. 


Prefix dict has been built succesfully. 
Full Mode: 我 /来 到 /北京 /清华 /清华 大 学 / 华 大 /大 学 
<class “generator'> 

Default Mode: 我 /来 到 /北京 /清华 大 学 

搜索 引擎 模式 : 我 /来 到 /北京 /清华 / 华 大 /大 学 /清华 大 学 
我 来 到 北京 清华 大 学 


jieba.cut for_search( 方 法 仅 有 一 个 参数 ， 为 分 词 的 字符 串 ， 该 方法 适用 于 搜索 引擎 构 
造 倒 排 索引 的 分 词 ， 粒 度 比 较 细 。 


5.3.4 为 jieba 添加 自 定义 词典 
国家 SA 级 景区 存在 很 多 与 旅游 相关 的 专 有 名 词 ， 举 个 例子 : 


[输入 文本 ] 故 言 的 著名 景点 包括 乾 清 言 、 太 和 殿 和 黄 琉 璃 瓦 等 
[精确 模式 ] 故宫 /的 /著名 景点 /包括 / 乾 / 清 宫 /、/ 太 和 殿 / 和 / 黄 /琉璃 瓦 /等 
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[全 模式 ] 故 宫 /的 /著名 /著名 景点 /景点 /包括 / 乾 / 清 宫 / 太 和 / 太 和 殿 / 和 / 黄 / 琉 璃 /琉璃 瓦 /等 

显然 ， 专 有 名 词 乾 清宫 、 太 和 殿 、 黄 琉璃 瓦 〈 假 设 为 一 个 文物 ) 可 能 因 分 词 而 分 开 ， 
这 也 是 很 多 分 词 工 具 的 一 个 缺陷 。 但 是 jieba 分 词 支持 开发 者 使 用 自 定 定 义 的 词典 ， 以 便 包 
含 jieba 词 库 里 没有 的 词语 。 虽 然 jieba 有 新 词 识 别 能 力 ， 但 自行 添加 新 词 可 以 保证 更 高 的 
正确 率 ， 尤 其 是 专 有 名 词 。 

其 基本 用 法 如 下 : 


jieba.load userdict (file name) #file name 为 目 定 义 词典 的 路 径 

词典 格式 是 一 个 词 占 一 行 ; 每 一 行 分 3 个 部 分 ， 一 部 分 为 词语 ， 男 一 部 分 为 词 频 ， 最 
后 为 词性 〈 可 省 略 ，jieba 的 词性 标注 方式 和 ICTCLAS 的 标注 方式 一 样 。ns 为 地 点 名 词 ， 
nz 为 其 他 专用 名 词 ，a 是 形容 词 ，v 是 动词 ，d 是 副词 )，3 个 部 分 用 空格 隔 开 。 例 如 以 下 
目 定义 词典 dict.txt: 

辊 清宫 5 ns 

黄 琉 璃 所 4 

云 计算 5 

李 小 福 2 nr 

八 一 双 鹿 3 nz 

凯特 琳 2 nz 


下 面 是 导入 目 定 义 词典 后 再 分 词 。 


import ]jlIeba 

TC odd userdict("alct xt") # 导 入 目 定义 词典 
text=" 故 宫 的 著名 景点 包括 辊 清宫 、 太 和 殿 和 黄 琉 璃 甩 等 " 

seg list=jieba.cut (text, cut all=False) # 精 确 模式 
print (" [精确 模式 ] : "，"/ ".join(seg list)) 


输出 结果 如 下 ， 其 中 专 有 名 词 连 在 一 起 ， 即 范 清 宫 和 黄 琉 璃 及。 
[精确 模式 ] :故宫 / 的 / 著名 景点 / 包括 / 辊 清宫 / 、/ 太 和 殿 / 和 / 黄 琉 璃 有 岂 / 等 


5.3.5 文本 分 类 的 关键 同 近 取 


当 文 本 分 类 时 ,在 构建 VSM (向 量 空 间 模 型 ) 的 过 程 中 或 者 把 文本 转换 成 数学 形式 的 
计算 中 ， 需 要 运用 到 关键 词 提取 的 技术 ，jieba 可 以 简便 地 提取 关键 词 。 
其 基本 用 法 如 下 : 


Jieba.analyse.extract tags (sentence, topK=20, withWeight =False, allowPOS=()) 


这 里 需要 先 import jieba.analyse。 其 中 ，sentence 为 等 提取 的 文本 ; topK 为 返回 几 个 
TF/IDF 权重 最 大 的 关键 词 ， 默认 值 为 20; withWeight 为 是 否 一 并 返回 关键 词 权 重 值 ， 默 认 
值 为 False; allowPOS 指 仅 包 合 指 定 词性 的 词 ， 默 认 值 为 空 ， 即 不 进行 科 选 。 


import jieba,Jieba.analyse 
Jieba.load userdict ("dict .txt") # 导 入 自 定义 词典 
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| 二 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


text=" 故 襄 的 著名 景点 包括 乾 清 言 、 太 和 殿 和 午 门 等 。 其 中 乾 清 宫 非常 精美 ， 午 门 是 紫禁城 的 
正门 ， 午 门 居中 辐 阳 。" 
seg list=jieba.cut (text, cut all=False) 
print ("分 词 结果 : "，"/".join(seg 1ist) ) # 精 确 模 式 
tags= ieba analvae extract tags(text topr=5} # 获 取 关 键 词 
print ("关键 词 : "”，"” ".join (tags)) 
tags=jieba.analyse.extract tags (text, topK=5,withWeight=True) 
# 返 回 关 键 词 权重 值 
print (tags) 


输出 结果 如 下 : 


分 词 结果 : ”故宫 /的 /著名 景点 /包括 / 辊 清宫 /、/ 太 和 殿 / 和 / 午 门 /等 /。/ 其 中 / 辊 清宫 /非常 / 精 
美 /，/ 午 门 /是 /紫禁城 /的 /正门 /，/ 午 门 / 居 中 /向 阳 /。 

关键 词 : 午 门 辊 清宫 著名 景点 太 和 殿 向 阳 

[(' 午 门 "，1.5925323525975001),(' 赣 清官"，1.4943459378625), ("着 名 景点 "， 
0.86879235325)，(' 太 和 殿 '，0.63518800210625),，(' 回 阳 '，0.578517922051875) ] 


其 中 ， 午 门 出 现 3 次 、 取 清 宫 出 现 两 次 、 著 名 景点 出 现 1 次 。 如 果 topK=5， 按 照 顺 序 输出 
提取 5 个 天 键 词 ， 则 输出 “ 午 门 殉 清 名 著名 景点 太 和 殿 癌 阳 ”。 
jieba.analyse.TFIDF (idf path=None)# 新 建 TFE/IDF 实例 ，idf_path 为 IDF 频率 文件 
关键 词 提 取 所 使 用 的 逆向 文件 频率 (IDF) 文本 语料库 可 以 切换 成 自 定 义 语料库 的 
路 径 。 
jieba.analyse.set idf path(file name) #file name 为 目 定义 语料库 的 路 径 
天 键 词 提取 上 所 使 用 的 停止 词 〈Stop Words) 文本 语料库 可 以 切换 成 目 定 义 语 料 库 的 路 径 。 


说 明 : TF/IDF 是 一 种 统计 方法 ,用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 
份 文件 的 重要 程度 。 字 词 的 重要 性 随 看 它 在 文件 中 出 现 的 次 数 成 正比 增加 ， 但 同时 会 随 看 
它 在 语料库 中 出 现 的 频率 成 反比 下 降 。TF/IDF 的 主要 思想 是 : 如 果 某 个 词 或 短语 在 一 篇 文 
草 中 出 现 的 频率 TF 高 ， 并 且 在 其 他 文章 中 很 少 出 现 ， 则 认为 此 词 或 者 短语 具有 很 好 的 类 
别 区 分 能 力 ， 适 合用 来 分 类 。 


5.3.06 deque 


deque (double-ended queue 的 缩写 ) 双 回 队列 类 似 于 list 列表 ， 位 于 Python 标准 库 
collections 中 。 它 提供 了 两 端 都 可 以 操作 的 序列 ， 这 意味 着 在 序列 的 前 后 都 可 以 执行 添加 
或 删除 操作 。 

@ 创建 双向 队列 deque 


from collections import deque 


d=deque () 
从 添加 元 素 


d=deque () 
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d.append (3) 
d.append (8) 
d.append (1) 


那么 此 时 d=deque([3,8,1])、len(d)=3、d[0]=3、d[-1]=1。 
deque 支持 从 任意 一 端 添加 元 素 。append0 用 于 从 右 端 添加 一 个 元 素 ，appendleftO 用 于 


从 左 端 添 加 一 个 元 素 。 


全 两 端 都 使 用 pop 

SequetT To 

dpop0O 抛 出 的 是 '3'，dpopleftO 抛 出 的 是 '1， 可 见 默 认 pop0 抛 出 的 是 最 后 一 个 元 素 。 
@@ 限制 deque 的 长 度 


d=deque (maxlen=20) 
for 1 in range(30): 


d.append (str (1)) 


此 时 d 的 值 为 d=deque(['10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23,, 


'24','25','26','27','28', '291], maxlen=20)， 可 见 当 限 制 长 度 的 deque 增加 超过 限制 数 的 项 时 男 
一 边 的 项 会 自动 删除 。 


@ 添加 list 的 各 项 到 deque 中 


d=deque ([1,2,3,4,5]) 
d.extend([0]) 


那么 此 时 d=deque([1,2,3,4,5,0])。 
d.extendleft([6,7,8]) 


此 时 d=deque([8,7,6,1,2,3,4,5,0])。 


5.4 程序 设计 的 步骤 


5.4.1 信息 采集 模块 一 一 网 络 讨 虫 的 实现 


网 络 疏 虫 的 实现 原理 及 过 程 如 下 : ene: 


(1) 获取 初始 的 URL。 和 初始 的 URL 地 址 可 以 由 用 户 指定 的 茶 个 或 订 视频 讲解 


几 个 初始 爬 取 网 页 决定 。 


(2) 根据 初始 的 URL 疏 取 页 面 并 获得 新 的 URL。 在 获得 初始 的 URL 地 址 之 后 ， 首 先 


需要 疏 取 对 应 URL 地 址 中 的 网 页 ， 在 爬 取 了 对 应 的 URL 地 址 中 的 网 页 后 将 网 页 存储 到 原 
始 数据 库 中 ， 并 且 在 爬 取 网 页 的 同时 发 现 新 的 URL 地 址 ， 将 已 谎 取 的 URL 地 址 存放 到 一 
个 已 爬 URL 列表 中 ， 用 于 去 重复 判断 爬 取 的 进程 。 


(3) 将 新 的 URL 放 到 URL 队列 中 。 注 意 ， 在 第 2 步 中 获取 了 下 一 个 新 的 URL 地 址 
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之 后 会 将 新 的 URL 地 址 放 到 URL 队列 中 。 
(4) 从 URL 队列 中 读 取 新 的 URL， 并 依据 新 的 URL 惧 取 网 页 ， 同 时 从 新 网 页 中 获取 
新 URL， 并 重复 上 述 的 爬 取 过 程 。 
(5) 当 满 足 爬 虫 系统 设置 的 停止 条 件 时 停止 疏 取 。 在 编写 爬虫 的 时 候 一 般 会 设置 相应 
的 停止 条 件 ， 如 果 没 有 设置 停止 条 件 ， 疏 虫 会 一 直 疏 取 下 去 ， 直 到 无 法 获取 新 的 URL 地 址 
为 止 ， 奉 设置 了 停止 条 件 ， 礁 虫 则 会 在 俘 止 条 件 满足 时 停止 爬 取 。 
根据 图 5-4 所 示 的 网 络 爬 虫 的 实现 原理 及 过 程 ， 这 里 指定 中 原 工 学 院 新 闻 门 户 的 URL 
地 址 “http://www.zut.edu.cn/index/xwdt.htm” 为 初始 的 URL。 


获取 初 
始 URL 


unvisited=deque () 
visited=setl) 


将 新 URL 放 
人 和 人 URL 队列 


将 已 爬 取 地 
址 放 到 已 的 
列表 中 


读 取 新 URL 


图 5-4 网 络 爬 虫 的 实现 原理 及 过 程 


使 用 unvisited 队列 存储 符 爬 取 URL 链接 的 集合 并 使 用 广度 优先 搜索 ， 使 用 visited 集 
合 存储 已 访问 过 的 URL 链接 。 


# 符 爬 取 链接 的 列表 ， 使 用 广度 优先 搜索 


# 已 访问 的 链接 集合 


在 数据 库 中 建立 两 个 table， 其 中 一 个 是 doc 表 ， 存 储 每 个 网 页 ID 和 URL 链接 。 


create table docl(id int primary key,link text) 


例如 : 


"hip /wat 
29 BEEos zak 
Sm mt 
4 http://www.zut 
0 Heen /Fm zor 
6 http://www.zut 
ehnttp: /ium Zut 


-edu. 
-edu. 
.edu. 
-edu 
-ednu . 
-edu. 


eu en/ intorid0s2/19933 


cn/index/xwdt .htm 
cn/info/1052/19838 
EXnmo0c21o9937 


.cn/info/1052/19836 


cn/inftfof1052/19835 
cn/info/1052/19834 


.htm 
.htm 
.htm 
.htm 
.htm 
-htm 


太一 个 是 word 表 ， 即 倒 排 表 ， 和 存储 词语 和 其 对 应 的 网 页 了 D 的 list。 
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create table word (term Varchar (25) primary key,l1ist text) 


如 果 一 个 词 在 某 个 网 页 中 出 现 多 次 ， 那么 list 中 这 个 网 页 的 序号 也 出 现 多 次 。list 最 后 
转换 成 一 个 字符 串 存 进 数 据 库 。 

例如 ， 词 “ 王 宗 敏 ” 出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 页 面 1 次 ，35 
号 页 面 3 次 ，88 号 页 面 两 次 ， 它 的 list 应 为 [12,35,35,35,88,88]， 转 换 成 字符 串 "12 35 35 35 
88 88" 存 储 在 Word 表 的 一 条 记录 中 ， 形 式 如 下 : 


term list 
王 宗 敏 12 35 35 35 88 88 
校友 会 54 190 190 701 986 986 1024 


息 取 中 原 工学 院 新 闻 网 页 的 代码 如 下 : 


#search engine build-2.py 
import sys 

from collections import deque 
import urllib 

from urllib import request 
import re 

from bs4 import BeautifulSoup 
import lxml 

import sqlite3 


import JjJieba 


ri "HE /Zu edu cn # 入口 
unvisited=deque () # 符 爬 取 链接 的 集合 ， 使 用 广度 优先 搜索 
visited=set () # 已 访问 的 链接 集合 


unvisited.append (url) 


conn=sqlite3.connect ('viewsdu.db') 

C=Conn .cursor () 

# 在 create table 之 前 先 drop table 是 因为 之 前 测试 的 时 候 已 经 建 过 table 了 ， 所 以 再 次 运 
# 行 代码 的 时 候 要 把 旧 的 table 删 了 重建 

Cc.execute('drop table doc ) 

c.execute('create table docl(id int primary key,link text)') 
c.execute('drop table word') 

c.execute('create table word (term varchar(25) primary key,l1ist text)') 
Conn commit) 

conn.close() 

Erinbl” 米 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 阔 开 - 妈 台 肥 取 六 六 六 六 六 六 玉米 六 六 六 六 闵 米 闵 闵 闵 闵 闵 闵 闵 闵 闵 闵 六， 】 

cnt=0 

Be 站 

while unvisited: 


url=unvisited.popleft () 
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visited add (turl) 
cnt+=1 


print (' 开 始 抓 取 第 ', cnt, ' 个 链接 : ' ,url) 


# 疏 取 网 页 内 容 
response=request .urlopen (url) 


content=response.read() .decode ("utf-8°") 


except: 

continue 
# 寻 找 下 一 个 可 有 扑 的 链接 ， 因 为 搜索 范围 是 网 站 内 ， 所 以 对 链接 有 格式 要 求 ， 需 根据 具体 情况 而 定 
# 解 析 网 页 内 容 ， 可 能 有 几 种 情况 ， 这 也 是 根据 这 个 网 站 网 页 的 具体 情况 写 的 
soup=BeautifulSoup (content,'lxml') 
lla soup: find all (Ca la pil # 本 页 面 所 有 的 新 闻 链 接 <a> 
For ea inalleas 

#print (a.attrs['href']) 

x=a.attrs['href'] # 网 址 

if re.match(r'http.+' ,zx) :# 排 除 是 http 开头 ， 而 不 是 http://www.zut.edu.cn 网 址 

1F,Tnotrresmatch(lrhitp -VW zuLV edu .cnt XZ): 


continue 
i Pemabellr Yintov eur): Eori0an/20314 Le 
X="http://www.zut.edu.cn'+x 
elif re.match(r'info/ Tr" x): "noi0d46/20314.htm" 
x="'http://www.zut.edu.cn/'+x 
She MEH onto/i0d46/203T4 NEm” 


x /A 2d ed Cn Trl22| 

STITTF Te mtel{lr VA ASNAnEGAET EDOa6720314 ntme 
x EED: /ZE een TS 2 

Do) 

3 上 EYEnTIWESITEeOCOnGT TOTIn nvioitedy. 


unvisited.append (x) 


a=soup.find('a',{'class"':"Next"}) <a 
if a=NOne: 
X= ttresl NreaErl # 网 址 


IF h(tr EROENY 人 3 
x="'http://www.zut.edu.cn/index/'+x 
else: 
x="'http://www.zut.edu.cn/index/xwdt/'+x 
1 NOL IIN visited}y landlr not Tn unwISsTLed 


unvisited.append (x) 


以 上 代码 实现 要 有 息 取 的 网 址 队列 unvisited。 
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5.4.2 索引 模块 一 一 建立 倒 排 词 表 


解析 新 闻 网 页 内 容 ， 这 个 过 程 需要 根据 这 个 网 站 网 页 的 具体 情况 来 处 理 。 


soup=BeautifulSoup (content, "lxml') 
title=soup.title 
article=soup.find('div',class ="'c67215 content',1id='vsb newscontent'"') 
author soup find(t'span' elass —"authorstvie67215") 于 作者 
time=soup.find('span',class ="timestyle67215") 
if title==None and article==None and author==None : 
print(' 无 内 容 的 页 面 。') 
continue 
elif article==None and author==None: 
print (' 只 有 标题 。') 
title=title.text 
title=" Join(title,. split(}) 
article="" 
author="" 
elif article==None: 
print (' 有 标题 有 作者 ， 缺 失 内容 ' ) 
title=title.text 
title="'" .join(title.split()) 
article="" 
author=author.get text ("",strip=True) 
author='' .join(author.split ()) 
elif author==None : 
print (2 有 标题 有 内 容 ， 缺 失 作者 ' ) 
title=title.text 
title="". Join{titles split()) 
article=article.get text ("",strip=True) 
article="''.Join(article.split()) 
author="" 
else: 
title=title.text 
title="'" .join(title.split()) 
article=article.get text ("",strip=True) 
article="''.Join(article.split()) 
author=author.get text ("",strip=True) 
author="'" .join(author.split ()) 
print (' 网 页 标题 ' ,title) 


提取 出 的 网 页 内 容 存 在 于 titlle、article、author 中 ， 对 它们 进行 中 文 分 词 ， 并 对 每 个 分 
出 的 词语 建立 倒 排 词 表 。 


seggen=Jieba.cut for search (title) 
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seglist=11ist (seggen) 
seggen=Jieba.cut for search (article) 
seglist+=1ist (seggen) 
seggen=Jieba.cut for search (author) 
seglist+=11ist (seggen) 


# 数 据 存 储 
conn=sqlite3.connect ("viewsdu.db") 
C=Cconn.cursor() 
c.execute('insert into doc values(?,?2)"', (cnt,url)) 
# 对 每 个 分 出 的 词语 建立 倒 排 词 表 
for word in seglist: 
#print (worad) 
# 检 验 看 看 这 个 词语 是 否 已 存在 于 数据 库 
c.execute('select 11st from word where term=?"', (word, )) 
result=c.fetchall () 
# 如 果 不 存 在 
ee、 
docliststr=str (cnt) 


c.execute('insert into word Values (?,?)"', (word,docliststr)) 


# 如 果 已 存在 

else: 
docliststr=result[0] [0] # 得 到 字符 串 
docliststri=" TStFTVCDE) 


C-execute ('updqate word set 11st=? where term=?', (docliststr,word)) 
Conn commitly 


conn.close() 


print (' 词 表 建 立 完毕 !! ') 


以 上 代码 只 需 运 行 一 次 即 可 ， 搜 索引 擎 所 需 的 数据 库 己 经 建 好 。 运 行 上 述 代码 出 现 如 
下 结果 : 


开始 抓 取 第 110 个 链接 : http://www.zut.edu.cn/info/1041/20191.htm 
网 页 标题 。 我 校 2017 年 学 生 奖 助 项 目 评 审 工作 完成 资助 育 人 成 效 显 著 - 中 原 工学 院 
开始 抓 取 第 111 个 链接 : http://www.zut.edu.cn/info/1041/20190.htm 
网 页 标题 。 ”我 校 教师 李 慕 杰 、 王 学 鹏 参加 中 国 致 公 党 河南 省 第 一 次 代表 大 会 -中 原 工 学 院 
开始 抓 取 第 112 个 链接 : http://www.zut.edu.cn/info/1041/20187.htm 
网 页 标题 : ”我 校 与 励 展 企 业 开 展 校 企 合作 -中 原 工 学 院 

开始 抓 取 第 113 个 链接 : http://www.zut.edu.cn/info/1041/20184.htm 
网 页 标题 : 平顶山 学 院 李 培 副 校长 一 行 来 我 校 考察 交流 -中 原 工学 院 

开始 抓 取 第 114 个 链接 : http://www.zut.edu.cn/info/1041/20179.htm 
网 页 标题 : 我 校 学 生 在 工程 造价 技能 大 赛 中 获 佳绩 -中 原 工学 院 

开始 抓 取 第 115 个 链接 : http://www.zut.edu.cn/info/1041/20178.htm 
网 页 标题 : 我 校 召 开 2018 届 毕 业 生 就 业 工 作 会 议 - 中 原 工学 院 
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5.4.3 网 页 排名 和 搜索 模块 


当 需 要 搜索 的 时 候 执 行 search_engine usepy， 完 成 网 页 排名 和 搜索 功能 。 We 

网 页 排名 采用 TF/IDF 统计 。TEF/IDF 是 一 种 用 于 信息 检索 与 数据 挖掘 视频 讲解 
的 常用 加 权 技 术 。TF/IDF 统计 用 于 评估 一 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 份 文件 的 
重要 程度 。TF 的 意思 是 词 频 (Term Frequency)，IDF 的 意思 是 逆 文 本 频率 指数 (Inverse 
Document Frequency)。TF 表示 词 条 t 在 文档 d 中 出 现 的 频率 。IDF 的 主要 思想 是 : 如 果 包 
含 词 条 t 的 文档 越 少 ， 则 词 条 t 的 IDF 越 大 ， 说 明 词 条 t 具有 很 好 的 类 别 区 分 能 力 。 

词 条 t 的 IDF 计算 公式 如 下 : 


id 全 log(N/df) 
其 中 ，N 是 文档 总 数 ，df 是 包含 词 条 +t 的 文档 数量 。 
在 本 程序 中 车 { 文 档 号 : 出 现 次 数 } 存 储 的 是 茶 个 词 在 文档 中 出 现 的 次 数 。 例 如 王 宗 敏 
的 t 人 三 {12:1，35:3，88:2} 即 词 “ 王 宗 敏 ” 出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 
页 面 1 次 ，35 号 页 面 3 次 ，88 号 页 面 两 次 。 
Score={ 文档 号 : 文档 得 分 } 用 于 存储 命中 〈 搜 到 ) 文档 的 排名 得 分 。 


#search engine use.py 

import re 

import urllib 

from urllib import request 

from collections import deque 
from bs4 import BeautifulSoup 
import lxml 

import sqlite3 

import JjJieba 

import math 

conn=sqlite3.connect ("viewsdu.db") 
C=Conn .cursor () 

Cc.execute('select count (*) from doc') 


N=1+c.fetchall() [0] [0] # 文 档 总 数 

target=input (' 请 输入 搜索 词 : ') 

seggen=]Jieba.cut for search (target) # 将 搜索 内 容 分 词 

SEO # 字 典 ， 用 于 存储 “文档 号 : 文档 得 分 ” 


for word in seggen: 
print (' 得 到 查询 词 : ' ,word) 
tf={} # 文 档 号 : 次 数 {12: 1，35: 3，88: 2] 
c.execute('select 11st from word where term=?"', (word,)) 
result=c.fetchall() 
entesulEy DO 
doclist=result[0] [0] # 字 符 串 “12 35 35 35 88 88” 
doclist=doclist.split(' ') 
netlist eLong | 


113 | 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


# 把 字符 串 转换 成 元 素 为 int 的 1ist[12,35,88] 
df=len (set (doclist) ) # 当 前 word 对 应 的 df 数 ， 注 意 set 集合 实现 去 掉 重复 项 
idf=math.log(N/df) 间 计 算出 IDF 
EnE 和 TGFE OO) 
for num in doclist: # 计 算 词 频 TF， 即 在 某 文档 中 出 现 的 次 数 
TE Tm a ts: 
tf[num]=tf [num]+l1 
else: 
tf[num]|=1 
#TF 统计 结束 ， 现 在 开始 计算 score 
和 下 5 
if num in Score : 
# 如 果 该 num 文档 已 经 有 分 数 了 ， 则 累加 
score[num]=score[num]+tf [num]*1idf 
else: 
score[num]=tf [num]*idf 
sortedlist=sorted (score.items (), key=lambda d:d[1],reverse=True) 
# 对 score 字典 按 字典 的 值 排 序 
#print (' 得 分 列表 '，, sortedlist) 
cnt=0 
for num,docscore in sortedlist: 
cnt=cnt+l1 
c.execute('select link from doc where 1id=?2"', (num,)) 
# 按 照 ID 获取 文档 的 连接 (网 址 ) 
url=c.fetchall()[0][0] 
print (url ，" 得 分 : ', docscore) # 输 出 网 址 和 对 应 得 分 
Er 
response=request .urlopen (ur]l) 
content=response.read() .decode ('utf-8') # 可 以 输出 网 页 内 容 
except: 
print ('oops... 读 取 网 页 出 错 ') 
continue 
# 解 析 网 页 输出 标题 
soup=BeautifulSoup (content, 'lxml') 
title=soup.title 
if title==None: 
prine(l NO ET 
else: 
title=title.text 
print (title) 
if cnt>20: # 超 过 20 条 则 结束 ， 即 输出 前 20 条 
break 
if cnt==0: 
print (' 无 搜索 结果 ') 
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当 运 行 search engine use.py 时 出 现 如 下 提示 : 


请 输入 搜索 词 : 王 宗 敏 

Building prefix dict from the default dictionary ... 

Loading model from cache C:\Users\xm]\AppData\Local\Temp\]Jieba.cache 
Loading model cost 0.961 seconds. 

Prefix dict has been built succesfully. 

得 到 查询 词 : 王 宗 敏 

idf: 3.337509562404897 

http://www.zut.edu.cn/info/1041/20120.htm 得 分 : 13.350038249619589 
王 宗 敏 校长 一 行 参加 深圳 校友 会 年 会 并 走访 合作 企业 -中 原 工 学 院 
http://www.zut.edu.cn/info/1041/20435.htm 得 分 : 13.350038249619589 
中 国 工 程 院 张 彦 仲 院士 莅临 我 校 指 导 工 作 - 中 原 工 学 院 
http://www.zut.edu.cn/info/1041/19775.htm 得 分 : 10.012528687214692 
我 校 河 南 省 功能 性 纺织 材料 重点 实验 室 接 受 现场 评估 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19756.htm 得 分 : 10.012528687214692 
王 宗 敏 校长 召开 会 议 推进 “十 三 五 ”规划 “ 八 项 工程 ”建设 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19726.htm 得 分 : 10.012528687214692 
我 校 2017 级 新 生 开 学 典礼 隆重 举行 -中 原 工学 院 
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6.1 程序 功能 介绍 


使 用 网 络 疏 虫 技术 疏 取 百度 图 片 某 主题 的 相关 图 片 ， 并 且 能 按 某 一 关 视频 让 解 
键 字 搜 索 图 片 下 载 到 本 地 指定 的 文件 夹 中 。 本 程序 主要 完成 下 载 功能 ， 不 需要 设计 图 形 化 
界面 。 在 运行 时 出 现 如 下 提示 : 


Please input you want search: 


让 用 户 输 入 关键 词 , 例如 输入 “ 夏 敏捷 ”, 然后 按 回 车 键 , 则 看 到 如 图 6-1 所 示 的 效果 。 


二 一 一 = RESTART: I:\ 《第 14 本 ) 各" 攻 局 项 目 紧 例 开发 《Python 课程 设计 和 案例) \ 百 度 图 片 下 载 00. py 二 == 一 


6-1 疏 取 百度 图 片 运行 效果 示意 图 
从 图 6-1 可 以 看 到 开始 下 载 了 。 


6.2 ”程序 设计 的 思路 


一 般 来 说 ， 制 作 一 个 息 虫 需要 分 以 下 几 个 步 又 : 
(1) 分 析 需 求 ， 这 里 的 需求 就 是 候 取 网 页 图 片 。 
(2) 分 析 网 页 源 代码 和 网 页 结构 ， 配 合 F12 键 碍 看 网 页 源 代 码 。 
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(3) 编写 正则 表达 式 或 者 XPath 表达 式 。 
(4) 正式 编写 Python 疏 虫 代码 。 
本 章 按照 该 步骤 实现 按 关 键 词 爬 取 百 度 图 片 。 


6.3 ”关键 技术 
6.3.1 图片 文件 下 载 到 本 地 


@ 使 用 requesturlretrieve0 国 数 
如 果 要 把 对 应 图 片 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieveO 函 数 。 


from urllib import request 
request.urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 
/lqjdycivgq5.jpg","aaa.Jjpg") 


上 例 就 可 以 把 网 络 上 中 原 工学 院 的 图 片 资源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaa.jpg 
图 片 文 件 。 
@ 使 用 Python 的 文件 操作 有 国 数 write0 写 人 文件 


from urllib import request 

import urllib 

url=" http://www.zzti.edu.cn/ mediafile/index/2017/06/24/1lqjdycivq5.jpg ' 

urll=urllib.request.Request (url) #Request () 函数 将 url 添加 到 头 部 ， 
# 模 拟 浏 览 器 访问 

page=urllib.request.urlopen (url1) .read()  # 将 url 页 和 面 的 源 代码 保存 成 字符 串 

#open () .write () 方 法 原始 且 有 效 


EDENYTC- AS ID mi) ET ES OOE) # 写 入 aaa .jpg 文件 中 


6.3.2 ” 改 取 指定 网 页 中 的 图 片 


首先 用 urllib 库 来 模拟 浏览 器 访问 网 站 的 行为 ， 由 给 定 的 网 站 链接 (url) 得 到 对 应 网 
页 的 源 代码 (html 标签 )。 其 中 ， 源 代码 以 字符 串 的 形式 返回 。 

然后 用 正则 表达 式 re 库 在 字符 串 〈 网 页 源 代 码 ) 中 匹配 表示 图 片 链 接 的 小 字符 串 ， 返 
回 一 个 列表 。 

最 后 循环 列表 ， 根 据 图 片 链接 将 图 片 保存 到 本 地 。 

urllib 库 的 使 用 在 Python2.x 和 Python3.x 中 的 差别 很 大 ， 本 案例 以 Python3 .x 为 例 。 


第 一 个 简单 的 息 取 图 片 程序 ， 使 用 Python3.x 和 urllib 与 re 库 


import urllib.request 
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P 项 目 案例 开发 
从 人 入门 到 实战 一 爬虫 、 游 戏 和 机 器 学 习 


Ort Te # 正 则 表达 式 
def getHtmlCode (url) : 捍 该 方法 传 入 url， 返 回 url 的 html 的 源 代码 
headers=t{ 
'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRASS8N) 
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Mobile 
SaEarI7537 36: 
} 
urll=urllib.request.Request (url, headers=headers) 
#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏 览 器 访问 
page=urllib.request.urlopen (urll) .read () 
# 将 url 页 面 的 源 代码 保存 成 字符 串 
page=page.decode ('UTF-8') ”音字 符 串 转 码 


return page 


def getImg (page) :# 该 方法 传 入 html 的 源 代码 ， 经 过 截取 其 中 的 img 标签 ， 将 图 片 保 存 到 本 机 
imgList=re.findall(r' (http:[^\s]l*? (jpglpnglgif))""',page) 


xXx=0 
Earl in imagqbist: # 列 表 循环 
EE 
print (' 正 在 下 载 : $s'%imgUrl[0]) 
#urlretrieve (url, 1ocal) 方 法 根据 图 片 的 url 将 图 片 保存 到 本 机 
urllib.request.urlretrieve (imgUrl[0],'E:/img/%d.]jJpg'%$x) 
x 二 + 二] 
except: 
continue 
if name =="' main ': 
url="'http://blog.csdn.net/qq 32166627/article/details/60345731'" 


# 指 定 网 址 页 面 
page=getHtmlCode (url) 
getImg (Page ) 

对 于 findall( 正 则 表达 式 ,代表 页 面 源 代码 的 st 函数 ， 在 字符 串 中 按照 正则 表达 式 截 取 
其 中 的 子 字符 串 ，findall0 返 回 一 个 列表 ,列表 中 的 元 素 是 一 个 个 元 组 ,元 组 的 第 1 个 元 素 
是 图 片 的 url， 第 2 个 元 系 是 url 的 扩展 名 ， 列 表 形 式 如 下 : 

Pimnttp avwakarsecsansneEy4EABALGOG 32166627 1BDg 2 Pd 


("Dts /avatar codn netirira2 fly vr Tog AD Ds 
(“nttp://avatar .csdn net ABS/2 OL30079000 De DG 


(nttp://avatar.cadn cnet/li/Be/ Ll cadn 5g2 pg 
上 述 代码 在 找 图 片 的 url 时 用 的 是 re《〈 正 则 表达 式 )。re 用 得 好 会 有 奇效 ， 用 得 不 好 效 
果 极 差 。 


既然 得 到 了 网 页 的 源 代码 ， 就 可 以 根据 标签 的 名 称 得 到 其 中 的 内 容 。 
由 于 正则 表达 式 难以 掌握 ， 这 里 用 一 个 第 三 方 库 一 一 BeautifulSoup， 它 可 以 根据 标签 
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的 名 称 对 网 页 内 容 进行 截取 。BeautifulSoup4 的 中 文 文档 请 参见 页 面 “http://beautifulsoup. 
readthedocs.10/zh CN/latest/”。 


6.3.3 ”BeautifulSoup 库 概 述 


BeautifulSoup 〈 英 文 原 意 是 美丽 的 蝴蝶 ) 是 一 个 Python 处 理 HTML/XML 的 图 数 库 ， 
是 Python 内 置 的 网 页 分 析 工 具 ， 用 来 快速 地 转换 被 抓 取 的 网 页 。 它 产生 一 个 转换 后 DOM 
树 ， 尽 可 能 和 原文 档 内 容 的 含义 一 致 ， 这 种 措施 通 弟 能 够 满足 用 户 搜集 数据 的 需求 。 

BeautifulSoup 提供 了 一 些 简 单 的 方法 以 及 类 Python 语法 来 查找 、 定 位 、 修 改 一 棵 转换 
后 DOM 树 。BeautifulSoup 目 动 将 送 进 来 的 文档 转换 为 Unicode 编码 ， 而 且 在 输出 的 时 候 
转换 为 UTF-8。BeautifulSoup 可 以 找 出 “所 有 的 链接 <a>”， 或 者 “所 有 class 是 xxx 的 链 
接 <a>”， 再 或 者 是 “所 有 匹配 .cn 的 链接 url”。 

@ BeautifulSoup 的 安装 

使 用 pip 直接 安装 BeautifulSoup4: 


pip3 install beautifulsoup4 


推荐 在 现在 的 项 目 中 使 用 BeautifulSoup4 (bs4)， 导 入 时 需要 import bs4。 

@ BeautifulSoup 的 基本 使 用 方式 

下 面 使 用 一 段 代码 演示 BeautifulSoup 的 基本 使 用 方式 。 

from bs4 import BeautifulSoup 

#doc 可 以 是 一 个 HTML 内 容 的 字符 串 ， 本 例 是 列表 ， 需 要 转换 成 字符 串 

doc=["'<html><head><title> The story of Monkey </title></head>', 
'<body><p id="firstpara" align="center">This 1s one paragraph </p>", 
'<p id="secondpara" align="center">This 1s two paragraph </p>", 
Ex | 

soup=BeautifulSoup(''.Join(doc), "html .parser") 

# 提 供 字 符 串 信息 ，' ' .join (doc) 将 其 合并 为 字符 串 
print (soup.prettify()) 


在 使 用 时 BeautifulSoup 首先 要 导入 bs4 库 : 

from bs4 import BeautifulSoup 

创建 BeautifulSoup 对 象 : 

soup=BeautifulSoup (html) 

另外 ， 还 可 以 用 本 地 HTML 文件 来 创建 对 象 ， 例 如 : 

soup=BeautifulSoup (open ('index.html') ，"html .parser")# 提 供 本 地 HTML 文件 


上 面 的 代码 是 将 本 地 index.html 文件 打开 ， 用 它 来 创建 soup 对 象 。 
用 户 也 可 以 使 用 网 址 URL 获取 HTML 文件 ， 例 如 : 


from urllib import request 


response=request .urlopen ("http://www.baidu.com") 
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html=response .read () 


html=html .decode ("utf-8") #qecode () 用 于 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 
soup=BeautifulSoup (html, "htm1l.parser") # 远 程 网 站 上 的 HTML 文件 


程序 段 最 后 格式 化 输出 BeautifulSoup 对 象 的 内 容 。 


print (soup.prettify(})) 
运行 结 末 如 下 : 


<html> 
<head> 
<title> The story of Monkey </title> 
</head> 
<body> 
<p align="center"™" id="firstpara"> 
This 1s one paragraph 
</p> 
<p align="center" id="secondpara"> 
This is two paragraph 
</p> 
</body> 
</html> 


以 上 便 是 输出 结果 ， 格 式 化 打印 出 了 BeautifulSoup 对 象 (DOM 树 ) 的 内 容 。 

BeautifulSoup 将 复杂 的 HTML 文档 转换 成 一 个 复 哥 的 树 形 结构 ， 其 中 每 个 结 点 都 是 
Python 对 象 。 所 有 对 象 可 以 归纳 为 4 种 ， 即 Tag、NavigableString、BeautifulSoup (前 面 例 
子 中 己 经 使 用 过 )、Comment。 

1 ) Tag 对 象 

Tag 是 什么 ? 通俗 点 讲 就 是 HTML 中 的 一 个 个 标签 ， 例 如 : 

<title> The story of Monkey </title> 

<a href="nhnttp://example.com/elsie" id="linkl">Elsie</a> 

上 和 面 的 <title>、<a> 等 HTML 标签 加 上 里 面包 括 的 内 容 就 是 Tag， 下 面 用 BeautifulSoup 
来 获取 Tags。 


print (soup. title) 
print (soup.head) 


输出 如 下 : 


<title> The story of Monkey </title> 
<head><title> The story of Monkey </title></head> 


用 户 可 以 用 BeautifulSoup 对 象 soup 加 标签 名 轻松 地 获取 这 些 标签 的 内 容 , 但 应 注意 ， 
它 查 找 的 是 所 有 内 容 中 第 1 个 符合 要 求 的 标签 ， 对 于 查询 所 有 的 标签 ， 将 在 后 面 进行 介绍 。 
可 以 验证 一 下 这 些 对 象 的 类 型 。 


print (type (soup.title)) # 输 出 : <class 'bs4.element.Tag'> 
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对 于 Tag， 它 有 两 个 重要 的 属性 一 一 name 和 attrs， 下 面 分 别 来 感受 一 下 。 


print (soup.name) # 输 出 : [document] 
print (soup.head.name) # 输 出 : head 


soup 对 象 本 身 比较 特殊 ， 它 的 name 即 为 [document]， 对 于 其 他 内 部 标签 ,输出 的 值 便 
为 标签 本 里 的 名 称 。 
print (soup-p-attrs) 下 


在 这 里 把 p 标签 的 所 有 属性 打印 输出 ， 得 到 的 类 型 是 一 个 字典 。 
如 条 想 要 单独 获取 茶 个 属性 ， 例 如 获取 它 的 ID 可 以 这 样 做 : 


Drint(sounp Bl GT # 输 出 : firstpara 
另外 还 可 以 利用 getO 方 法 传 入 属性 的 名 称 ， 二 者 是 等 价 的 。 
Drinttsonp pp qet( ia # 输 出 : firstpara 


用 户 可 以 对 这 些 属性 和 内 容 等 进行 修改 ， 例 如 : 


Soup-p['" class'"]="newClass"” 


另外 还 可 以 对 这 个 属性 进行 删除 ， 例 如 ; 
del Soup-pP['- class |】 


2) NavigableString 对 象 
既然 已 经 得 到 了 标签 的 内 容 ， 要 想 获 取 标 签 内 部 的 文字 怎么 办 呢 ? 很 简单 ， 用 .string 
有 J， 例如 : 


soup.title.string 


这 样 就 轻松 获取 到 了 标签 里 面 的 内 容 ， 如 果 用 正则 表达 式 则 有 犬 烦 得 多 。 

3) BeautifulSoup 对 象 

BeautifulSoup 对 象 表示 的 是 一 个 文档 的 全 部 内 容 。 大 部 分 时 候 可 以 把 它 当 作 Tag 对 象 ， 
它 是 一 个 特殊 的 Tag， 下 面 的 代码 可 以 分 别 获 取 它 的 类 型 、 名 称 以 及 属性 。 


print (type (soup)) # 输 出 : <class 'bs4.BeautifulSoup'> 
print (soup.name) # 输 出 : [document] 
print (soup.attrs) # 输 出 空 字典 ，{] 


4) Comment 对 象 
Comment (注释 ) 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 ， 其 内 容 不 包括 注释 符 
号 ， 如 果 不 好 好 地 处 理 它 ， 可 能 会 对 文本 处 理 造成 意 想 不 到 的 麻烦 。 


6.3.4 用 BeautifulSoup 库 操作 解析 HTML 文档 树 
@ 遍历 文档 树 
1 ) 用 .content 属性 和 .children 属性 获取 直接 子 结 点 
Tag 的 .content 属性 可 以 将 Tag 的 子 结 点 以 列表 的 方式 输出 。 
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print (soup.body.contents) 
输出 : 


[<p align="center" id="firstpara">This 1s one paragraph</p>, 


<p align="center" id="secondpara">This is two paragraph</p>] 
此 时 输出 为 列表 ， 可 以 用 列表 索引 来 获取 它 的 条 一 个 元 系 。 

print (soup.body.contents[0]) # 获 取 第 1 个 <p> 

输出 : 

<p align="center" id="firstpara">This is one paragraph </p> 


.children 属性 返回 的 不 是 一 个 list， 它 是 一 个 list 生成 器 对 象 ， 不 过 用 户 可 以 通过 过 历 
获取 所 有 子 结 拟 。 


for child in soup.body.children: 
print (child) 


输出 : 


<p align="center" id="firstpara"> This 1s one paragraph </p> 


<p align="center" id="secondpara">This is two paragraph </p> 


2) 用 .descendants 属性 获取 所 有 子孙 结 点 
.contents 和 .children 属性 仅 包 含 Tag 的 直接 子 结 点 ，.descendants 属性 可 以 对 所 有 Tag 
的 子孙 结 点 进行 递归 循环 ， 和 .children 类 似 ， 用 户 也 需要 过 有 历 获取 其 中 的 内 容 。 


for child in soup.descendants: 
printichnrla) 


可 以 发 现 ， 所 有 的 结 点 都 被 打印 出 来 ， 先 是 最 外 层 的 HTML 标签 ， 其 次 从 head 标签 
一 个 个 剥离 ， 依 此 类 推 。 

3) 结 点 内 容 

如 果 一 个 标签 里 面 没 有 标签 了 ， 那 么 .string 就 会 返回 标签 里 面 的 内 容 。 如 果 标 签 里 面 
只 有 唯一 的 一 个 标签 ， 那 么 .string 也 会 返回 最 里 面 标签 的 内 容 。 

如 果 Tag 包含 了 多 个 子 标签 结 点 ，Tag 将 无 法 确定 .string 方法 应 该 调用 哪个 子 标签 结 
点 的 内 容 ，.string 的 输出 结果 是 None。 


print (soups title.string) # 输 出 <title> 标 签 里 面 的 内 容 

print (soup. body.string) #<body> 标 签 包含 了 多 个 子 结 点 ， 所 以 输出 None 
输出 : 

The story of Monkey 

None 

4) 父 结 所 

.parent 属性 用 于 获取 父 结 点 。 
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p=soup.title 


print (p.parent .name) # 输 出 父 结 点 名 Head 
输出 : 

Head 

以 上 是 过 历 文 档 树 的 基本 用 法 。 

全 搜索 文档 树 


1) find all(name, attrs, recursive, text, **kwargs) 

find all0 方 法 搜索 当前 Tag 的 所 有 Tag 子 结 点 ， 并 判断 是 否 符 合 过 滤器 的 条 件 ， 其 参 
数 如 下 。 

(1) name 参数 : 可 以 查找 所 有 名 字 为 name 的 标签 。 

printlsoup tingd si ) # 输 出 所 有 <p> 标 签 

[<p align="center™" jd="firstpara">This is one paragraph</p>, <p align= 

"center" id="secondpara">This 1s two paragraph</p>] 

如 果 name 参数 传 入 正则 表达 式 作 为 参数 ，BeautifulSoup 会 通过 正则 表达 式 的 match() 
来 匹配 内 容 。 下 面 的 例子 找 出 所 有 以 h 开头 的 标签 。 


for tag in soup.find alll(re.compile("^h")): 
print (tag.name, end=" ") #html head 


输出 : 
html head 


这 表示 < html > 和 < head > 标签 都 被 找到 。 

(2) attrs 参数 : 按照 tag 标签 属性 值 检索 ， 需 要 列 出 属性 名 和 值 ， 采 用 字典 形式 。 

SO Endralld Dattra I "id Firatodranii GET SO 

ESEDOBEa 

它们 都 是 查找 属性 值 id 是 "firstpara" 的 <p> 标 签 。 

当然 也 可 以 采用 关键 字形 式 “soup.find all(p' {id="firstpara"})”。 

(3) recursive 参数 : 在 调用 Tag 的 find all0 方 法 时 BeautifulSoup 会 检索 当前 Tag 的 所 
有 子孙 结 点 ， 如 果 只 想 搜索 Tag 的 直接 子 结 点 ， 可 以 使 用 recursive=False。 

(4) text 参数 : 通过 text 参数 可 以 搜索 文档 中 的 字符 串 内 容 。 

print (soup.find all (text=re.compile ("paragraph")))#re.compile() 正则 表达 式 

输出 : 

['This is one paragraph', ‘This is two paragraph'] 

re.compile("paragraph") 为 正则 表达 式 ， 表 示 所 有 含有 “paragraph” 的 字符 串 都 匹配。 

(5) limit 参数 : find_all0 方 法 返回 全 部 的 搜索 结构 ， 如 朱文 档 树 很 大 ， 那 么 搜索 会 很 
慢 。 如 果 用 户 不 需要 全 部 结果 ， 可 以 使 用 limit 参数 限制 返回 结果 的 数量 ， 当 搜索 到 的 结果 
数量 达到 limit 的 限制 时 就 停止 搜索 返回 结果 。 
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文档 树 中 有 两 个 Tag 符合 搜索 条 件 ， 但 结果 只 返回 了 1 个 ， 因 为 限制 了 返回 数量 。 
oup tngd alt("p Lamt 1) 
输出 : 


[<p align="center" id="firstpara">This 1s one paragraph</p>] 


2) find(name, attrs, recursive, text) 

它 与 find all0 方 法 唯一 的 区 别 是 find_ all0 方 法 返回 全 部 结果 的 列表 ， 而 fnd(O 方 法 返 
回 找 到 的 第 1 个 结果 。 

@@ 用 CSS 选择 器 筛选 元 素 

在 写 CSS 时 标签 名 不 加 任何 修饰 ， 类 名 前 加 点 ，ID 名 前 加 #。 在 这 里 也 可 以 利用 类 似 
的 方法 来 筑 选 元 素 ， 用 到 的 方法 是 soup.select()， 人 返回 类 型 是 列表 。 

(1) 通过 标签 名 查找 : 


Soup select(’titlie") # 选 取 <title> 元 素 
(2) 通过 类 名 查找 : 
SOURseeELET Firstnarary # 选 取 class 是 firstpara 的 元 素 


soup.select one(".firstpara") # 但 找 class 是 firstpara 的 第 1 个 元 素 

(3) 通过 id 名 查找 : 

soup.select ('#firstpara') # 选 取 id 是 firstpara 的 元 素 

以 上 的 select(0) 方 法 返回 的 结果 都 是 列表 形式 ,可 以 用 遍历 形式 输出 ,然后 用 get_text() 
方法 或 text 属性 来 获取 它 的 内 容 。 


soup=BeautifulSoup (html, ‘'htm]l .parser') 
print type (soup.select('div')) 


print(soup.select (div) [01 -get text()) # 输 出 首 个 <div> 元 素 的 内 容 
for title In soups select("title”}): 
print (title.text) # 输 出 所 有 <div> 元 素 的 内 容 


处 理 网 页 需要 对 HTML 有 一 定 的 了 解 ，BeautifulSoup 库 是 一 个 非常 完备 的 HTML 解 
析 函 数 库 ， 有 了 BeautifulSoup 库 的 知识 ， 就 可 以 进行 网 络 爬 虫 实战 了 。 


from bs4 import BeautifulSoup 


def getHtmlCode (ur1l) : # 该 方法 传 入 url， 返回 url 的 html 的 源 代码 
headers=t{ 
'User-Agent': 'MMozilla/5.0(Windows NT 6.1; WOW64; rv:31.0) Gecko/ 


20100101 Firefox/31:.0" 


} 
urll=urllib.request.Request (url, headers=headers) 

#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏览 器 访问 
page=urllib.request.urlopen (urll) .read () 

# 将 url 页 面 的 源 代 码 保存 成 字符 串 
page=page.decode ('UTF-8') ， # 字 符 串 转 码 
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return page 


def getImg (page, localPath): 
# 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 片 保存 到 本 机 
soup=BeautifulSoup (page, 'html .parser') # 按 照 html 格式 解析 页 面 


imgList=soup.find all('img') # 返 回 包含 所 有 img 标签 的 列表 
X=0 
for imgUrl in imgList: # 列 表 循 环 


print(' 正 在 下 载 : %s'%imgUrl.get('src')) 
#urlretrieve (url, 1ocal) 方 法 根据 图 片 的 url 将 图 片 保存 到 本 机 
urllib.request.urlretrieve (imgUrl .get ('src'),1localPath+'%d.]jJpg "$x) 
X+ 王 ] 
if name ==' main _'": 

url="'http://www.zhangzishi.cc/20160928gx.html'" 

localPath="'E:/img/'" 

page=getHtmlCode (url) 

getImg (page, localPath) 


可 见 使 用 BeautifulSoup 能 比 使 用 正则 表达 式 更 简单 地 找到 所 有 img 标签 。 


6.3.5 requests 库 的 使 用 


requests 库 和 urllib 库 的 作用 相似 且 使 用 方法 基本 一 致 ， 都 是 根据 HITP 协议 操作 各 种 
消息 和 页 面 ， 但 使 用 requests 库 比 使 用 urllib 库 更 简单 些 。 

@@ requests 库 的 安装 

使 用 pip 直接 安装 requests: 

pip3 install requests 

安装 后 进入 Python 导入 模块 测试 是 否 安装 成 功 。 

import requests 

没有 出 错 即 安装 成 功 。 

对 于 requests 库 的 使 用 ， 请 读者 参阅 “http://cn.python-requests.org/zh CN/latest/”。 

发 送 请 求 很 简单 ， 首 先 要 导入 requests 模块 : 


>>>import requests 


接 下 来 获取 一 个 网 页 ， 例 如 中 原 工学 院 的 首页 : 


>>>r=requests.get ('http://www.zut.edu.cn') 


之 后 就 可 以 使 用 这 个 rf 的 各 种 方法 和 函数 了 。 
另外 ，HTTP 请 求 还 有 很 多 类 型 ， 例 如 POST、PUT、DELETE、HEAD、OPTIONS,， 
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可 以 用 同样 的 方式 实现 : 


>>> r=requests.post ("http://httpbin.org/post") 


>>> r=requests.head ("http://httpbin.org/get") 

在 URL 中 传递 参数 

有 时 候 需 要 在 URL 中 传递 参数 ,比如 在 采集 特 度 搜索 结果 时 , 对 于 wd 参数 (搜索 词 ) 
和 m 参数 (搜索 结果 数量 )， 可 以 通过 字 和 从 串 连 接 的 形式 手工 组 成 URL， 但 requests 提供 
了 一 种 简单 的 方法 : 

> le A 是 李 人 ern 210 

>>> r=requests.get ("http://www.baidu.com/s", params=payload) 

> rinttrearly 


结果 如 下 : 


http://www.baidu.com/s?wd=%E5%A4%S8F%E6%95%8F$%E6$%8DSB7&rn=100 


上 面 w= 的 乱码 就 是 “ 夏 敏 捷 ” 的 URL 转 码 形式 。 


POST 参数 请 求 例子 如 下 : 
requests.post('http://www.itwhy.org/wp-comments-post.php', data= 
{'comment': ' 测 试 POST'}) #POST 参数 

@ 获取 响应 内 容 


>>> Tr=redquests .gdet('http://www.balidu.com') # 返 回 一 个 Response 对 象 工 
>>> -Lext 


在 使 用 requests0 方 法 后 会 返回 一 个 Response 对 象 ， 其 存储 了 服务 器 啊 应 的 内 容 ， 如 
上 实例 中 已 经 提 到 的 rtext。 

用 户 可 以 通过 text 来 获取 网 页 的 内 容 。 

结果 如 下 : 


"<!1DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content-— 
type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible 


content=IE=Edge><meta content=always name=referrer>..."' 
另外， 还 可 以 通过 rcontent 来 获取 页 面 内容 。 

>»>>> TT: Content 

r.content 以 字 节 的 方式 去 显示 ， 所 以 在 IDLE 中 以 b 开头 。 

>>> r.encoding # 可 以 使 用 r .encoding 来 获取 网 页 编码 
结果 如 下 : 

'utf-8， 


当 发 送 请 求 时 ，requests 会 根据 HITP 头 部 来 获取 网 页 编码 ; 当 使 用 rtext 时 ，requests 
就 会 使 用 这 个 编码 。 当 然 ， 用 户 还 可 以 修改 requests 的 编码 形式 。 
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>>> r=requests.get ('http://www.zhidaow.com') 
>>> r.encoding 

下 

>>>r .encoding="'ISO-8859-1" 


像 上 面 的 例子 ， 对 encoding 修改 后 直接 用 修改 后 的 编码 去 获取 网 页 内 容 。 

©@ JSON 

如 果 用 到 JSON， 就 要 引入 新 模块 ， 例 如 json 和 simplejson， 但 在 requests 中 己 经 有 了 
内 置 的 函数 frjson0。 这 里 以 查询 卫 的 API 为 例 : 


>>>r=requests.get ('http://ip.taobao.com/service/getIpInfo.php?ip= 

0 0 pa es 1 a 

> es 

i es TOOOOE be he 
Ga mtry omntry 1 0700 isp "re ld 
"city': "郑州 '，'ip': '202.196.32.7'，'region': ' 河 南 '，'isp id': 
a Te et A ns OCT eo 

>>>F -135on(tyt'data ll country" | 


' 中 国 ' 


@ 网 页 状态 码 
用 户 可 以 使 用 rstatus_code 来 检查 网 页 的 状态 人 码 。 


>>>r=requests.get ('http://www.mengtiankong .com') 
>>>r.status code 

200 

>>>r=requests.get ('http://www.mengtiankong.com/123123/") 


>>>r.status code 


404 
此 时 ， 能 正常 打开 网 页 的 返回 200， 不 能 正常 打开 的 返回 404。 
@ 响应 的 头 部 内 容 


用 户 可 以 通过 rheaders 来 获取 啊 应 的 头 部 内 容 。 


>>>r=requests.get ('http://www.zhidaow.com') 

>>> r.headers 

{ 
'content-encoding': 'gzip', 
'transfer-encoding': 'chunked', 
'content-type': 'text/html; charset=utf-8"'; 


} 
可 以 看 到 以 字典 的 形式 返回 了 全 部 内 容 ， 用 户 也 可 以 访问 部 分 内 容 。 


>>> r.headers['"'Content-Type'"] 
'text/html; charset=utf-8" 
>>> r.headers.get ("content-type') 
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text/html;: charset=utf-8" 


全 设置 超时 时 间 
用 户 可 以 通过 timeout 属性 设置 超时 时 间 ， 一 旦 超过 这 个 时 间 还 没有 获得 啊 应 内 容 ， 
就 会 提示 错误 。 
>>> requests.get('http://github.com', timeout=0.001) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


requests .exceptions.Timeout: HTTPConnect1ionPool (host="'github.com', 


port=80): Reduest timed out. (timeout=0.001) 
@ 代理 访问 
在 采集 时 为 避免 被 封 IP， 经 常会 使 用 代理 。requests 也 有 相应 的 proxies 属性 。 


import requests 
proxies={ 
"http": "http://10.10.1.10:3128", 
"https": "http://10.10.1.10:1080", 
} 


requests.get ("http://www.zhidaow.com", proxles=proxies) 


如 果 代 理 需 要 账户 和 密码 ， 则 需要 这 样 : 


proxies={ 
"nttp": "http://user:pass@10.10.1.10:3128/", 
} 


@ 请 求 头 内 容 
请 求 头 内 容 可 以 用 rrequest.headers 来 获取 。 


>>>r .reduest .headers 


{'Accept-Encoding': '1IdentlIity，dqeflate， compress, gzip', 
'Accept': '*/*', 'User-Agent': 'python-requests/1.2.3 CPython/2.7.3 Windows/XxP"} 
人 和 自 定义 请 求 头 部 


伪 靶 请 求 头 部 是 爬虫 采集 信息 时 经 音 用 到 的 ， 用 户 可 以 用 这 个 方法 来 隐藏 目 己 


>>>r=requests.get ('http://www.zhidaow.com') 
>>>print (r.request.headers['User-Agent']) # 输 出 python-requests/2.13.0 
>>>headers={'User-Agent': ‘'xm]"'} 
>>>r=requests.get ('http://www.zhidaow.com', headers=headers) 
# 伪 装 的 请 求 头 部 
>>>print (r.request.headers['User-Agent'] ) # 输 出 xm]， 避 人 免 被 反扑 虫 


再 例如 为 一 个 定制 header 的 例子 : 


import requests 
import JjJson 


data={'some': "data'} 
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headers={'content-type': "appllicatlion/]son ' ， 
"User-Agent'': 'Mozl11la/5.0(XL17 Ubuntuy Linux x86 64; rv:22.0) 
Gecko/201700L01VEirTetort22 0"1 
r=requests.post('https://api.github.com/some/endpoint', data=data, 
headers=headers,) 


prinCire text) 


下 面 用 requests 库 蔡 换 urllib 库 , 并 用 open0.write(0) 方 法 蔡 换 卸 urllib.request.urlretrieve 
(url, localPath) 方 法 来 下 载 中 原 工学 院 主页 上 的 所 有 图 片 。 


使 用 requests、bs4 库 下 载 中 原 工学 院 主页 上 的 所 有 图 片 


import os 
import requests 
from bs4 import BeautifulSoup 
def getHtmlCode (url): # 该 方法 传 入 url， 返回 url 的 html 的 源 代 码 
headers=t{ 
'User-Agent': ‘MMozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/ 
20100101 Firefox/31.0" 
} 
r=requests .get (url,headers=headers) 


r.encoding="'UTF-8" # 指 定 网 页 解析 的 编码 格式 
page=r .text # 获 取 url 页 面 的 源 代 码 字 符 串 文本 


return page 


def getImg (page,localPath) : # 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 
# 片 保存 到 本 机 
if not os.path.exists(localPath):  # 新 建文 件 夹 
osmkdir(localpathy 
soup=BeautifulSoup (page, 'html .parser') # 按 照 ntml 格式 解析 页 面 
imgList=soup.find all('img') # 返 回 包 含 所 有 img 标签 的 列表 
x=0 
FOr mgUr LU in malList: # 列 表 循 环 
本 时 
Brint(" 正 在 下 载 : $57%1imgUrl det ("src")) 
if "http://" not in imgUrl.get('src'): 间 不 是 绝对 路 径 http 开始 
m="'http://www.zut.edu.cn/'+imgUrl .get ('src') 
print (' 正 在 下 载 : $s's%m) 
ir=requests.get('http://www.zut.edu.cn/'+imgUrl .get ('src')) 
else: 
ir=requests.get (imgUrl .get ('src')) 
# 用 write () 方 法 写 入 本 地 文件 中 
open (localLPath+'gsd.]jpg'sx，"wb') .write(ir.content) 
又 + 二 1 


except: 
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continue 
if name ==' main _'": 
url=" http://www.zut.edu.cn/' 
localPath="'E:/img/" 
page=getHtmlCode (ur]1) 
getImg (page, localPath) 


掌握 上 述 技术 后 先 爬 取 较 简单 的 搜狗 图 片 中 某 主 题 的 图 片 。 

输入 搜狗 图 片 的 网 址 “http://pic.sogou.com/”， 进 入 壁纸 分 类 ， 然 后 按 F12 键 进入 开 友 
人 员 选 项 (编者 用 的 是 Google Chrome 浏览 器 )。 右 击 某 张 图 片 , 在 快捷 菜单 中 选择 “检查 ” 
命令 ， 结 果 如 图 6-2 所 示 。 


TS 三 [ 瑟 ] 区 
/加 全 下 - 杰 括 - 探 向 图片 x 
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WESYAISHICE THANESStan= EA NE ow 2%2610749613 
ime src-"httes://ineo?. socgoucdn. cor/a002/1905729074/cr04acea.." width-"329"” neient-"2990"> -== $9 
/a 


图 6-2 ”网 页 代码 示意 图 


发 现 需 要 的 图 片 是 在 img 标签 下 的 ， 于 是 先 试 看 用 Python 的 requests 提取 该 组 件 ， 进 
而 获取 img 的 src， 然 后 使 用 urllib.request.urlretrieve 逐个 下 载 图 片 ， 从 而 达到 批量 获取 资 
料 的 目的 。 扑 取 的 URL 如 下 : 

http://pic.sogou.com/pics/recommend?category=%B1%DA%D6%BD 

此 URL 来 自 进 入 分 类 后 的 浏览 占 的 地 址 栏 。 

写 出 如 下 代码 : 


import requests 

import urllib 

from bs4 import BeautifulSoup 

res=requests.get ('http://pic.sogou.com/pics/recommend?category= 
$Bl1%SDASD6%SBD' ) # 扑 取 的 URL 
soup=BeautifulSoup (res.text, 'html .parser') 


print (soup.select ('img"')) 


输出 : 
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[<img alt=" 搜 狗 图 片 " src="/news/images/tupian130x34 Q1x.png" srcset= 
"/news/images/tupianl30x34 @2x.png 2x"/>, <img class="st-load" src=""/>] 


此 时 有 现 输出 内 容 并 不 包含 想 要 的 图 片 元 素 ， 而 是 只 齐 析 到 Logo《〈 见 图 6-3) 的 img， 
这 显然 不 是 大 家 想 要 的 。 也 束 是 说 , 需要 的 图 片 资 料 不 在 “http://pic.sogou.com/pics/recommend? 
category 一 %B1%DA%D6%BD” 的 HTML 源 代 码 里 面 。 


SS 


图 6-3 tupian130x34 Q@1x.png 


这 是 为 什么 呢 ? 可 以 发 现 当 在 网 页 内 辐 下 滑动 鼠标 滚轮 时 图 片 是 动态 刷新 出 来 的 ， 也 
就 是 说 ， 该 网 页 并 不 是 一 次 加 载 出 全 部 资源 ， 而 是 动态 加 载 资 源 。 这 也 避免 了 因为 网 页 过 
于 爱 肿 而 影响 加 载 速 度 。 在 网 页 动态 加 载 中 找 出 图 片 元 素 的 方法 如 下 : 

按 Fl12 键 ， 在 Network 的 XHR 下 单 击 文件 链接 ， 在 Preview 选项 卡 中 观察 结果 ， 如 
图 6-4 所 示 。 


[x | Elements Console Sources Network Timeline Proilles Application Security Audits 


三 O 本 可 |Vview: 旺 三 | 国 Preservelog 国 Disable cache | Offline No throttling Vv 


[Fitt 日 Regex @ Hide data URLs All | EY Js css Img Media Font Doc WS Manifest Other 


| 10000 ms 20000 ms 30000 ms 40000 ms 50000 ms 60000 ms 70000 ms 80 


Name Xx Headers Preview Response Cookies Timing 
| | getAllRecomPicByTag.jsp?category=%E5%A3%81%E7%BA%B8atag=%E... 了 {category: “壁纸 "，tag: “全 部 "，star 
pall items: [{id: 11984943, did: 8,..}, {id: 
catcgory: "有 辟 纸 " 
fromItem: null 
groupList: null 
items: null 


itemsOnPage: 6 
1/ 36 requests | 3.0 KB /7.1 KB transferred | Finish: 2.3 min | DOMC... maxEnd: 12129 


图 6-4 分 析 网 页 的 JSON 数据 


说 明 : XHR 的 全 称 为 XMLHttpRequest， 中 文 解释 为 可 扩展 超 文 本 传输 请 求 。 其 中 ， 
XML 是 可 扩展 标记 语言 ，Http 是 超 文本 传输 协议 ，Request 是 请 求 。XMLHttpRequest 对 象 
可 以 在 不 同 服 务 器 提交 整个 页 面 的 情况 下 实现 局 部 更 新 网 页 。 当 页 面 全 部 加 载 完 毕 后 ， 客 
户 端 通 过 该 对 象 加 服务 器 请 求 数据 ， 服 务 器 端 接收 数据 并 处 理 后 同 客户 站 反 饿 数据。 
XMLHttpRequest 对 象 提供 了 对 HTTP 协议 的 完全 访问 ， 包 括 做 出 POST 和 HEAD 请 求 以 
及 普通 的 GET 请 求 的 能 力 。XMLHttpRequest 可 以 同步 或 异步 返回 Web 服务 器 的 响应 ， 并 
且 能 以 文本 或 者 一 个 DOM 文档 的 形式 返回 内 容 。 尺 省 名 为 XMLHttpRequest, 但 它 并 不 限 
于 和 XML 文档 一 起 使 用 ， 它 可 以 接收 任何 形式 的 文本 文档 。XMLHttpRequest 对 象 是 为 
AJAX 的 Web 应 用 程序 染 构 的 一 项 关键 功能 。 

单 击 图 6-4 中 的 JSON 数据 all items， 必 现下 面 是 一 个 个 貌似 图 片 的 元 素 。 试 看 打开 
一 个 URL， 发 现 确实 是 图 片 的 地 址 。 找 到 目标 之 后 单 击 XHR 下 的 Headers 得 到 : 

http://pic.sogou.com/pics/channel/getAllRecomPicByTag.]Jsp?category=%ES%A3%81%E7 
YBA%B8RKtag=%ESY%8IY%ALSYEQ9SL83%A SRstart=0&len=15&width=1536&height=864 

试看 去 挥 一 些 不 必要 的 部 分 ， 技 巧 就 是 删 挥 可 能 的 部 分 之 后 访问 不 受 影 响 ， 最 后 得 到 
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的 URL 如 下 : 
http://pic.sogou.com/pics/channel/getAllRecomPicByTag.]sp?category=%ES%A3%81%E7 
2%0BA9?%oB8&tag="%oE32%0832%0A8?%oE99%083%0A8&start0&]len=15 
从 字面 意思 知道 category 后 面 可 能 为 分 类 。start 为 开始 下 标 ，len 为 长 度 ， 即 图 片 的 数 
量 。 通 过 这 个 URL 请 求 得 到 啊 应 的 JSON 数据 中 包含 看 用 户 所 需要 的 图 片 地 址 。 有 了 上 面 
的 分 析 可 以 写 出 以 下 代码 : 


import requests 
import json 
import urllib 
def getSogouImag (category, length,path): 
n=length 
cate=category 
imgs=requests.get ("http://pic.sogou.com/pics/channel/ 
getAllRecomPicByTag.]sp?category="'+cate+'&tag=%E5%85%A8%E9%83%A8&start= 
Og&len="'+str (n)) 
J]d=]json.1loads (imgs .text) 
J]d=jd['"'all items'] 
imgs url=[] 
For An dd 
imgs url.append(j['bthumbUrl"']) 
m=0 
For my orl nnmgS Js 
print ('***** 【十 S 七 (m)+" .JPpG *****'+"'Downloading*…"') 
urllib.request.urlretrieve (img url,path+str (m)+"' .Jpg') 
m=m+1 
print ('Download complete!') 
getSogouImag (' 壁 纸 ' ,200,'D:/download/ 壁 纸 /') 
# 下 载 200 张 图 片 到 DD 盘 download 下 的 “壁纸 ”文件 夹 中 


程序 运行 结果 如 图 6-5 所 示 。 


SOFTWARE (Dj ， dcwmload ， 芋 纸 En 匠 一 
工 RIm 帮 吹 (H) 
共 吾 呈 旅社 如 KJ 片 齐 避 新党 廊 件 实 


入 WW 下 isi 闻 一 


ljpg 


图 6-5 爬 取 到 了 D 盘 download 下 “壁纸 ”文件 夹 中 的 图 片 
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至 此 ， 关 于 该 息 虫 程序 的 编程 介绍 完毕 。 从 整体 来 看 ， 找 到 需要 有 息 取 元 素 所 在 的 url 
征 爬 虫 诸多 环节 中 的 关键 。 
有 了 用 搜狗 图 片 下 载 图 片 的 基础 ， 下 面 来 实现 百度 图 片 的 图 片 下 载 。 


6.4 ”程序 设计 的 步 又 
6.4.1 分 析 网 页 源 代码 和 网 页 结构 


进入 日 度 图 片 界面 (https://image.baidu.com/ )， 输 入 攻 个 关键 子 〈( 例 如 明敏 捷 )， 然 后 
单 击 “ 百 度 一 下 ”按钮 搜索 ， 可 见 如 下 网 址 : 

https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&1lm=—1&cl=2&1e=g 
bk&word=%CFY%C4%C3%F4%BDY%DDARfr=alakala=1&alatpl=adress&pos=0&hs=2&xthttps 
=]111111 
其 中 ，%CF%C4%C3%F4%BD%DD 就 是 “ 夏 敏 捷 ” 的 URL 编码 〈 网 址 上 不 使 用 汉字 )， 
所 看 见 的 页 面 是 “瀑布 流 版 本 ”( 如 图 6-6 所 示 )， 当 同 下 滑动 的 时 候 可 以 不 集 刷 新 ， 这 是 
一 个 动态 的 网 页 〈 和 搜狗 图 片 类 似 ， 需 要 按 F12 键 ， 通 过 Network 下 的 XHR 去 分 析 网 页 
的 结构 )， 而 用 户 可 以 选择 更 简单 的 方法 ， 就 是 单 击 网 页 右上 方 的 “传统 翻 页 版 本 ”( 如 
图 6-7 所 示 )。 


SO 


共 百 这 图 片 百度 接 索 。 ”Xx 党 ttps://image.baiducom，x 时 发 百度 图 片 -发 现 多 彩 世界 ” x 》》 党 页 化 捷 百度 图 片 搜索 本 


ee a 


a) lc lS 


€ CC @ https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fi -8&s 
:应 用 图 建议 网 站 从 I 正中 导入 党 [百度 一 下 ] 易 网 史上 日 HTML5 中 国 : 中 国生 ” 症 清华 大 学 出 版 社 旗舰 ”和 册 游戏 - 莫 课 网 凶 | Pythoni 沦 坛 -国内 最 六 


0969 - 
Bai 人 图片 号 吉 捷 | 


网 页 ”新闻 贴吧 向 症 音乐 图 上 请 视频 地 图 文库 更 多 > 


sl 


图 片 访 先 》 ”百度 首页 。xmi 33 ~ ”我 的 司 片 ” 攻 纺 翻 页 版 本 


Q 相关 搂 索 : ” 敏 接 套 = 何 敏 撞 ”敏捷 松 ”敏捷 ”敏捷 二 ” 叶 敏捷 ” 候 敏 撞 。 敬 捷 型 ” 赵 歌 捷 。” 锅 歌 捷 。” 吕 敏 捷 。” 杨 敏 捷 ” 范 敏 捷 。” 顾 敏 捷 ” 韩 敏 捷 
@ LL 


Basic .NET 


Visual 
程序 设计 教程 


图 6-6 瀑布 流 版 本 下 的 图 片 


在 传统 翻 页 版 本 下 的 浏览 堪 地 址 栏 中 可 见 如 下 网 址 : 


https://1mage.baidu.com/search/flip?tn=baiduimage&1ie=gbk&word=%CF%C4%C3%F4% 
BD%DD&ct=201326592&1lm=—1&v=flip 
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加 三 'E| 
和 营 百度 图 片 百度 接 幸 X 1 二 2 ttps://image.baidu.com i 党 百度 回 户 -发现 寡 彩 世界 ”XX 党 夏 颌 汗 百度 图 片 搜索 x 全 二 


i C 晶 https:image.baidu.corrysearchyflip?tn=baiduimage&ie=utf-8&word= 豆 敏捷 &ct=201326592&ic=0&lm=-1&owidth= a 
5: 应 用 四 建 义 网 站 癌 从 正中 导入 当 [百度 一 下 ] 易 网 易 回 HTML5 中 国 : 中 国生 ”站 清华 大 学 出 版 社 旗舰 ”入 游戏 - 莫 课 网 全 | Pythoni 允 坛 -国内 是 $ 


(1 ~ = 
Bai 合 图片 ” 夏 吉 捷 So nl 百度 首页 xmj 33 ~ 我 的 图 片 ” 温 布 流 版 本 


| q 让 竹 捷 套 。” 何 敏 捷 ”和 攻 捷 术 ”敏捷 ”敏捷 二 ” 叶 敏 捷 ” 修 敏 捷 ”各 捷 型 架 节 捷 ” 吕 敬 捷 。” 杨 敏捷 ” 范 敏 捷 ” 顾 敏 捷 ” 韩 敏 捷 


图 6-7 传统 翻 页 版 本 下 的 图 片 


在 传统 翻 页 版 本 下 单 击 “ 下 一 页 ”或 菜 数 字 页 码 ， 网 址 会 发 生变 化 ， 而 动态 网 页 则 不 

， 因 为 其 分 页 参数 是 在 POST i 人 在 该 程序 中 使 用 这 个 网 址 请 求 页 面 。 

在 网 页 空白 处 右 击 选择 “查看 网 页 的 源 代 码 ” 命 令 ， 可 以 查看 网 页 的 源 代 码 (如 图 6-8 
所 示 )， 也 就 是 requests get 下 来 的 数据 ， 在 这 里 面 找到 各 个 图 片 的 链接 和 下 一 页 的 链接 比 
较 困 难 。 


| 党 所 度 辐 片 _ x ' 好 2 ttpPsyyimage.baiducor X 办 百度 图 片 -点 现 名 和 彩 世界 X 各 豆 印 捷 自 开 图片 滩地 x 党 view-source:https:/fir Xx 


© 量 view-source:https://image.baidu.com/search/flip?tn=baiduimage&ie=Uutf-8&word= 下 敏捷 &ct=201326592&ic= 08dm- 六 
:应 用 罗 建 议 网 站 回 从 IE 中 导入 省 [四 度 -下 ] 匈 网 号 日 HTML5 让 司 宁国 年 日 般 # 清华 大 学 出 版 社 模 肌 向 诸 戏 - 茸 主 网 | Pythoni8 坛 国内 三 
/scr ipt> <script tpE "text/ javascript” src="/ inel. bdstat ic, constatio comm annod 6f6741d js” »*/script> 


<2crlipt» 
yz 记录 页 面 开 始 时 间 
window. page tartTine = new Date 0d. 


window. scrollTo (0, 0 ; 
/script> 
link rel="stylesheet” type="text/css” href="//ingl.tdstatic.com static/ searchresult result 2109f7c. css"yY>slink rel="stylesheet” type-"text/css” 

href="/ /ingD. tdstatic. com’static/ scarchresult/result/ result flip ddbf9al. css /Airk rel="styleshect” type="toxt/css” 
href=" “ingl. bdstatic. com static/ comorypkg, co bleb78d cas ‘PAink rel="styleshe=t" twpe="teyt/ces" 

drinel,tdstatic, com’static/ comor Wideet/Uisslicder/slider eccel95, css"/><lirnk rel=" stylesheet” type=" text/css” 

-LVingD。 tdstat ic. pe Pe tT Fr et dl Css Rte rel=" styleshect” type=" text/Css” 
1dget 1 T09328, css pe rel-" stylesheet” type-" text/css" 

Fo 3 ear ch wideet/ ni/ hase pW hb ZE E hl ZE F 5T7as SS /PCIrk reL= stylesheet™ 
type= tert/ ors he imz 0. 1 1 idget/uirbase vicw bvl cFiltezyis hrT Fi ltorView Ceapb92. csxs" /7 <link rel=" styleshect” 
ty7Eec "textrcss” hraf-" /im l. 1c, static/! searchresult/widgat/ ui/bas vi en AuColorWallFilt sr ey AvColorWallFilterTiew cfBa646. Cas ee 
rel=" stylesheet” type=" text/css” href=" 3 2 BLE F , 2 3 
rel=" stylesheet" type=" text/Css” href="/r im = rie Co ph Pe 好 deE eDisorderTi ebisorder7i 42b50F0, Css SA Fe] 六 ER 
type-"text/ces” hraf=", 0.bdastatic, com statlcl sear hresult/widget/fly ing _b3bc8dg. cgz /Fead> acript>» alce( speed set  ， ht’, new Datel ; </acript> 
<body class="flin"> <script type=” text/ Javascrint >reqlre, sitellS hk remure. sitells (["searchresult", Common “]] :reqmre.resolrceyan (I res”: 
fcommorm' wideet/uirbase/base, js": {Url”:" /ingd, bdstatic. Co st atic/comory wi dget /ui baserbase a66ce51. js"}," comon:widget/ ui/arcky router. js”: 
{url":"//imeD, bdst atic. cam statio/ comon/widget/ vi/arcW router_ 16T0dct. js ,pke ;comom:pl’," ders”: 

[“comnon: widget /ui base/base. js ]}, "cmmn Ww deet /ui archyapp. js : 

{url":"/ /imez. bdst atic. Com staticy comorv widset/ uirarch aop_cldac05. is”, pke’ :Common:pl deps”: 

[comon: widect /ui base/base, js" commm wideet/ uy arcdv router, js“ ]}," common: ideet/ui/base/EvertDi spat cher. i : 

{url" :mgD bdst atic. com/static/ comonwidget,/ uir/base/ FrentDispatcher_ eT1d337. js” ,pke”: ‘commor': pl "conmem 0 ja: 
{url":"/ im bdst atic. Comy staticy comov Widget ibase events_ febhdelf. js ， “me common:pl ders 

[“comon: widgetPulirbasceybasec. js", cammors videct/ ui base/EvertDi spat cher. js "]]}," common: widget/ i/arcW bohavior/pagercsizer. ef- 域 | 

furl :imgl.bdst atic. Comv staticy commory widget/ iarclv bahavior/pageresizer-_ 0f0 旺 7T0. js ,phe :comon:pl’," deps”: 

[commorm' widset /ui base/base, js commorm videet/ui base/ everts, js ] common: 丙 下 此 /ui arch/1cc 了 中 ， JS 

{url":"/ /imel. bdst xic.comystatIcy comov widgetyuirarclw lopcaldb_lfaga65. js", pke” : “commonsp]l "deps”: 

[ commorm'wadgetAPulirbssebase. js"]}, conmnw deet/ul archycollaction js": 


图 6-8 ”传统 翻 页 版 本 下 的 图 片 


用 户 可 以 通过 浏览 船 《〈 例 如 Chrome) 的 开 友 者 工具 来 查看 网 页 的 元 素 ， 按 F12 键 打 
开 开 发 者 工具 来 查看 网 页 样式 ， 注 意 当 鼠标 从 结构 表 中 滑 过 时 会 实时 显示 此 段 代码 所 对 应 
的 位 置 区 域 (注意 先 要 单 击 开 友 者 工具 右上 角 的 盘 头 按钮 用 户 可 以 通过 此 方法 快速 地 找 
到 图 片 元 素 所 对 应 的 位 置 〈《 如 图 6-9 所 示 )。 


| 134 


第 6 曹 疏 虫 应 用 一 一 抓 取 百 度 图 片 


[x 中 Elements Console Sources Network Timeline Profiles Resources Security Audits 
TIV IVU DINUCTUTCINMECLITC 


div id="specialRecomend" > /div 
vxdiv id="ingid' 
VY ul class="imglist" 
Voi class="ingitenm" style="width:372px; 
Vea target=” blank" class="imelink" style="width;372px" href="/search/detail?ct=503316480&isflip= =182=uncef: ned&tn=baiduimagedetailhipn=,.41%2F25929280%2F71476%2F2c65610c%2F5e 
jmg src="https://ss0.bdstatic .com/79cFuHSh OlYnxGkpoWK HF 6hhy /it/u=3577097530,16917507348fm=27&gp=0.jog” style="width:180px;height:180px;top:Opx;left:96px;” alt="net 程 
/a 
p<div class="hover”title="net 程序 供 计 教程 /<strong》 夏 第 醒 C/strone> 等 "》,.</ div 
11i 
Vii class="ingitem" style="width:372px; 


Vea target=” blank" class="inglink” style="width:372px" href="/se arch ‘detail?ct=503316480&isflip=1&z =UnGef ned&tn=baiduimagedetail&ipn=,.%3A%2F%2Fimg3x2, ddimg ,cn%2F10%2F9A2F- 
s:/ : = style= “width:180px; height:180px;top:0px; left:96px; ”alt=" java 池 戏 ! 


p <div class="hover”title="java 莲 戏 编 得 开发 教程 郑 秋生 ,<strong3 夏 改 捷 ( /strong>》, 疡 关 , 程 传 旧 , 王 佩 才 362419914">。(ydiy 
/1i 
《li class="ingitenm" style="width:372px; ">.c/11 
html bodyfip dv#wrapper div#imgContainer dwv#imgd ulimalist liimgitem img | 


图 6-9 图 片 元 系 所 对 应 的 位 置 


对 图 6-9 分 析 可 知 ， 每 个 图 片 都 在 <ul class="imglist"> 下 的 列表 项 <li class="imgitem" 
style="width:372px:"> 中 ， 其 中 <img src="..."> 保 存 图 片 的 网 址 。 


<div id="imgid"> 
<ul class="imglist"> 
<1i class="imgitem" style="width:372px;"> 
<a target=" blank" 
<img src="https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1HF6hhy/it/ 


u=3577097530,1691750734&amp; fm=27&amp; gp=0.jpg"” alt="net 程序 设计 教程 "> 
</a> 
<div class="hover" title="net 程序 设计 教程 /<strong> 夏 敏捷 </strong> 
等 "></div> 
el 


从 上 面 找到 了 一 张 图 片 的 路 径 : 

https:/ss0.bdstatlc.comy70cFuHSh QlYnxGkpoWK1HF6hhy/it/u=3577097530,16917507 
34&amp:ftm=27&amp:sp=0.]pg 

用 户 可 以 在 HIML 源 代 码 中 搜索 此 路 径 找 到 它 的 位 置 ， 如 下 : 


flip.setData('imgData', 

{ "queryEnc":"%E5SA4%8F%E6%95%8F%E6%S8D$SB7", "displayNum":5722, "bdIsClustered" 
Nm In 0 2archTrmn 
"jsNeedAsyncRequest":0, 

Gate [LOURD” "itp SS0O Dtatre Com Dcrasn 
QlYnxGkKpPOWK1HF6hhy/it/u=3577097530,1691750734&fm=27&gp=0.Jpg", 
"middleURL": "https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1lHF6hhy/it/u= 


3577097530,1691750734&fm=27&gp=0.Jpg", "largeTnImageUrl":"", "hasLarge"” :0, 
"hoverURL":"https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWKlHF6hhy/it/u= 


3577097530,1691750734&fm=27&gp=0.jpg", "pageNum":0, 


"obJURr= http /nl 3600vying Comn0/ Es/t86/241/26929280/714716/ 


2c65610c/54484fe6Nb33010bd.jJpg", 
"fromURL":"ippr ZzZ2C$qAZzdH3FAZdH3Ftp]j4 z&e3B31 z&e3Bv54AzdH3F8nc9adan0n 


Ze3Bipds"” "fromURLHost”":"item gcon "Currentindexz™”:"" "width”:800., 
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he = 00 Tye a "tileslzen DOSECTEYOe 0. 
"i -I 00LI A990 "Lr reerid 0 etn mn 0 
“imanewsDate SL 000 08:00 


可 见 “thumbURL”“middleURL” 和 “objURL” 均 是 图 片 的 所 在 网 址 ， 这 里 选用 
“objURL” 对 应 的 网 址 图 片 ， 所 以 写 出 如 下 正则 表达 式 获 取 图 片 的 所 在 网 址 : 


re.findall('"ob]jURL":"(.*?2)""',content, re.s) 
通过 分 析 可 知 ,“ 下 一 页 ”或 菏 数 字 页 码 HTML 的 代码 如 下 : 


<div id="page"> 

<strong><span class="pc">1</span></strong> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%8F%$E6%95%8F%$E6%8D$SB7 
&pn=20&gsm=3c&ct=&1ic=0&lm=-l&width=0&height=0"><span class="pc" data="right"> 
2</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%AA4%S8F%$E6%95%$8F%$E6S8D$SB7 
&pn=40&gsm=0&ct=&ic=0&lm=-l&width=0&height=0"><span class="pc" data= 
"iht" >3</opnan></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%S8F%$E6%95%8F$SE6%S8DSB7 
&pn=180&gsm=0&ct=&ic=0&lm=-l&width=0&height=0"><span class="pc" data= 
"right">10</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%S8F$E6%95%8F$SE6S8DSB7 
Enin 20RgS0 ICECE lc Ein Tewvidth OraeiqhnE 0 class "np </a> 
/QTw> 


所 以 获取 “下 一 页 ”链接 写 出 如 下 正则 表达 式 : 


re.findall('<div id="page">.*<a href="(.*?)" class="n">',content,re.s) [0] 


6.4.2 ”设计 代码 


Python 息 虫 搜索 白 度 图 片 库 并 下 载 图 片 的 代码 如 下 : 


import requests # 首 先导 入 库 视频 讲解 

import re 

# 设 置 默 认 配 置 

MaxSearchPage=20 # 搜 索 页 数 

CurrentPage=0 # 当 前 正在 搜索 的 页 数 

DefaultPath="pictures" # 默 认 储存 位 置 

NeedSave=0 # 是 否 需要 储存 

# 图 片 链接 正则 和 下 一 页 的 链接 正则 

def imageFiler (content) : # 通 过 正则 获取 当前 页 面 的 图 片 地 址 数组 
return re findallt(t'"ob URL":"(-*+2)"" Content re.S) 

def nextSource (Content) : # 通 过 正则 获取 下 一 页 的 网 址 


next=re.findall('<div id="page">.*<a href="(.*?)" class="n">", 


content, re.S})10] 
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第 6 曹 疏 虫 应 用 一 一 抓 取 百 度 图 片 


print (" 一 一 一 一 一 一 一 一 一 "+"http://image.baidu.com"+next) 
return next 
# 爬 虫 主体 
def spldler(source) : 
content=requests.get (source) .text # 通 过 链接 获取 内 容 
imageArr=imageFiler (content) # 获 取 图 片 数 组 
global CurrentpPage 
print ("Current page:"+str (CurrentPage)+"******p* 六 六 六 六 水 闵 冰冰") 
for imageUr]l in imageArr: 
print (imageUrl1) 
global NeedSsave 


if NeedSave: # 如 果 需 要 保存 图 片 则 下 载 图 片 ， 否 则 不 下 载 图 卢 
global DefaultPath 
rT 


# 下 载 图 片 并 设置 超时 时 间 ， 如 果 图 片 地 址 错误 就 不 继续 等 待 了 
picture=requests.get (imageUr]l,timeout=10) 
except: 
print ("Download image error! errorUrl:"+imageUrl1l) 
continue 
# 创 建 图 片 保存 的 路 径 
imageUrl=imageUrl.replace('/','') .replace(':',"''). 
replace("?","") 
pictureSavePath=DefaultPath+imageUrl 
fp=open (pictureSavePath, 'wb') # 以 写 入 二 进 制 的 方式 打开 文件 
fp.write (picture.content) 
下 和 CLOSE 
global MaxSearchPade 
if CurrentPpage<=MaxSearchpage: # 继 续 下 一 页 爬 取 
1 nextsourcelcontentks 
CurrentPage+=1 
# 疏 取 完 毕 后 通过 下 一 页 地 址 继续 爬 取 
spidler ("http://image.baidu.com"+nextSource (content)) 
# 疏 虫 的 开局 方法 
def begqlinSearch (page=1, save=0, savePath="pictures/"): 
# (page : 讨 取 页 数 , save :是 否 储存 , savePath :默认 储存 路 径 ) 
global MaxSearchPage,NeedSsave, DefaultPath 
MaxSearchPage=page 


NeedSave=save # 是 否 保存 ， 值 为 0 不 保存 ，1 保存 
DefaultPath=savePath # 图 片 保存 的 位 置 


key=input ("Please input you want search: ") 
startSource="http://image.baidu.com/search/flip?tn= 
baiduimage&ie=utf-8&word="+str (key)+"&ct=201326592&v=fl1ip" 
# 分 析 链 接 可 以 得 到 ， 蔡 换 其 "word" 值 后 面 的 数据 来 搜索 关键 词 

spidler (StartSource) 


# 调 用 开局 的 方法 就 可 以 通过 关键 词 搜索 图 片 了 
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begqlinSearch (page=5, save=1) #page=5 是 下 载 前 5 页 ，save=1 为 保存 图 片 


运行 后 输入 搜索 天 键 词 ， 例 如 “ 夏 敏捷 ”， 可 以 在 pictures 文件 夹 下 得 到 夏 敏捷 的 相关 
图 片 ， 如 图 6-10 所 示 。 这 里 下 载 的 图 片 的 命名 采用 的 是 下 载 的 网 址 ， 所 以 需要 去 除 文件 名 
不 允许 的 特殊 字符 ， 例 如 “:””/””?” 等。 当然 ， 更 好 的 处 理 方法 是 文件 名 采用 数字 编号 ， 
避免 网 址 中 出 现 特殊 字符 。 


豆 信 抬 2 () ， {第 14 本 ) Python 轻松 学 项目 实例 开发 【 Python 课程 设计 突 例 ] ， pictures 


打印 交 录 新 开 文件 天 上 丘 ~ 团 人 @ 
全 入 个 改 己 隐 二 大 小 
EE httpg-ecdimages-smazon.comimagesG28800K-Catslogshfz20101117B0040IF6VQ 01 amznjpg 2018/2/6 8.49 JPEG Image 30 
局 ptpimg002.21cnimg.comphotosalbum20160511m6005C25578C2AEC044F4324EAEEBCAFO18C jpeg 2018/2/6 3:49 JpEG Image 22 
加 httpimg3x2.ddimg.cn1091293525892-1 u 2jpg 2018/2/6 8.49 DE 20 
Ehtpimg13,360buyimg.comnDifst58524126929280714762c65610c54484fe6Nb33010bdjpg 2018/2/6 3:49 JPEG Image 146 
局 httpimg14.360buyimg.comnOjfst1273309228568970105843d71a1e0550b853bN692a3537.jpg 2018/2/5 8:49 JPEG Image 47 
Be) httpimgs.soufun.comnews2014 0801news1406359161065 000jpg 2018/2/6 8:49 JPEG Image 34 
httpimgs.soufun.comnews2013_0930news1380523396671_000Jpg 2018/2/6 8.49 JPEG Image 52 
EE httpimg3ml.ddimg.cn39221067418831-1u ljpg 2018/2/6 3:49 JPEG Image 10 
司 | httppicuser.cityB.comnewsimage2014073010fca02c847161599d1ie95743bd_pl_mkl.jpg 20186/216 8:49 JPEG imaq= 185 
加 | httpqgnimg zowoyoo.comimg2801791493550929586,pg 2018/2/6 38:49 JPEG Image Ee 
Ehttpimgl.gtimg.comhouse_guangzhoupicshv175165147595954025.jpg 2018/2/6 8:49 JPEG Image 106 
尼 | httpimgq.mp.sohucomq_minic zoom,w 6d40upload201705020765918aaaa54a43b5b06f6000b245ed4 thj.. 2018/276 93:49 JPEG Image 29 
be httpwrww, kfzimg.comGOIMOl1S809o4YBAFQWSdCABzRIAAAtQoGNZXYB63_n,jpg 2018/2/6 8:49 JPEG Image 11 
局 httpwww.aipai.comappwwwtemplatescommonimguploadnewcms201308091376013272 9521 1jpg 2018/2/6 8:49 JPEG Image 35 

‘ [4 » 

img.cn1091293525892.. 花 运 日 花 指定 沦 树 日 区 WH 大 小 : 19.2 KB 必 译 : 添 jnfF 麻 
fi 汪 加 二 i 记 RJ: 800 x B00 标 司 : 运 jh 标 各 


6-10 ”pictures 文件 夹 下 得 到 相关 图 片 
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7.1 itchat 功能 介绍 


本 程序 运行 后 会 出 现 一 张 二 维 码 图 片 ， 微 信用 户 通 过 微 信 扫描 二 维 码 
登录 目 己 的 微 售 ， 此 时 如 果 有 好 友 发 过 来 信息 ， 则 微 信 机 器 人 会 目 动 回复 好 友 ， 效 果 如 
图 7-1 所 示 。 在 该 图 中 可 以 看 到 当 好 友 发 过 来 “你 好 吗 ” 微 信 机 器 人 会 目 动 回 复 “还 人 不错， 
你 呢 ”; 当 好 友 发 过 来 “ 讲 个 实话 吧 ”， 微 信 机 大 人 会 自动 回复 一 个 突 话 ; 当 好 友 问 “郑州 
天 气 ? ”时 ， 微 信 机 器 人 会 目 动 回 复 天 气 情况 ， 等 等 。 


党 还 不 错 ， 你 呢 


春节 快乐 


本 万 事 如 意 心 想 事 成 ， 红包 合 来 。 
郑州 天 气 ? 
Pe 郑州 : 周 六 ,多 云 转 小 雨 东北 风 微 风 , 
最 低 气 温 2 度 ， 最 高 气温 11 度 


讲 个 笑话 吧 ea 
ee 毕加索 毕生 反对 侵略 战争 ， 维 护 世 
界 和 平 。 第 二 次 世界 大 战 期 间 ， 德 
国 的 将 领 和 士兵 经 常 出 入 巴黎 的 毕 
加 索 艺术 馆 ， 在 艺术 馆 的 出 口 处 ， 
毕 加 素 发 给 每 个 德国 军人 一 幅 他 的 
名 画 《 烙 尔 尼 卡 》 的 复制 品 ， 这 幅 


© ©) 由 


国 


7-1 微 信 机 器 人 聊天 效果 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


7.2 程序 设计 的 思路 


该 程序 需要 用 到 一 个 Python 库 一 一 1tchat，itchat 是 一 个 开源 的 微 信 个 人 账号 的 接口 ， 
可 以 使 用 该 库 进行 微 信 网 页 版 中 的 所 有 操作 ;， 男 外 还 需要 用 到 图 灵机 器 人 API， 图 灵机 器 
人 是 一 个 中 文 语 境 下 的 对 话机 器 人 。 本 章 主要 使 用 itchat 库 和 图 灵机 器 人 API 完成 一 个 能 
够 处 理 微 信 消息 的 图 灵机 器 人 ， 包 括 好 友 聊 天 、 和 群 聊 天 。 


7.3 关键 技术 
7.3.1 安装 itchat 


itchat 是 一 个 开源 的 微 信 个 人 账号 的 接口 ， 使 得 Python 调用 微 信 功 能 从 未 如 此 简单 ， 
用 户 使 用 不 到 三 十 行 的 代码 就 可 以 完成 一 个 能 够 处 理 所 有 信息 的 微 信 机 器 人 。itchat 库 已 经 
做 好 了 用 代码 调用 微 信 的 大 多 数 功 能 ， 使 用 起 来 非常 方便 ， 官 方 搁 术 文 档 的 网 址 为 
“http://itchat.readthedocs.io/zh/latest/”， 用 户 在 使 用 时 需要 安装 itchat 库 ， 在 安装 的 时 候 使 用 
pip 即 可 。 


7.3.2 itchat 的 登录 微 信 


运行 以 下 代码 ， 会 出 现 一 张 图 7-2 所 示 的 二 维 码 ， 扫 人 码 登 录 之 后 将 会 给 “文件 传输 助 
手 ” 发 送 一 条 “Hello, filehelper” 的 消息 。 


图 7-2 二 维 码 
import itchat # 加 载 itchat 库 
itchat.auto login() # 登 录 微 信 


# 发 送 文 本 消 轧 ， 发 送 目 标 是 “文件 传输 助手 ” 


litchat .send('Hello，fllehelper'，toUserName='fllehelper') 
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第 7 章 itchat 应 用 一 一 微 信 机 费 人 ( / 


itchat 的 消息 类 型 


itchat 文 持 所 有 的 消息 类 型 与 群 聊 。 在 itchat 中 定义 了 文本 、 图 片 、 名 片 、 位 置 、 通 知 、 


import itchat 


分 齐 、 文 件 等 多 种 消息 类 型 ， 可 以 分 别 执行 不 同 的 处 理 。 下 面 的 示例 注册 了 一 个 消息 啊 应 
事件 ， 用 来 定义 接收 到 文本 消息 后 如 何 处 理 。 


# 注 册 消 息 啊 应 事件 ， 消 息 类 型 为 itchat .content .TEXT， 即 文本 消息 ， 把 装饰 器 写成 下 面 的 形 


# 式 即 可 


Qitchat.msg register (Itchat .content .TEXT) 


def text reply (msg) : 
# 返 回 同样 的 文本 消息 


return msgd[ "Text ' 


Itchat .auto login() 


# 登 录 做 信 


# 绑 定 消息 啊 应 事件 后 让 itchat 运行 起 来 ， 监 听 消 息 


tehat runt) 


itchat.content 中 包含 所 有 的 消息 类 型 参数 ， 如 表 7-1 所 示 。 
表 7-1 itchat.content 中 所 有 的 消息 类 型 参数 


参 数 “类 型 Text 键 值 
TEXT 文本 内 容 (文字 消息 ) 
MAP 位 置 文本 (位 置 分 享 ) 
CARD 推荐 人 字典 (推荐 人 的 名 片 ) 
SHARING 分 享 名 称 〈 分 享 的 音乐 或 者 文章 等 ) 
PICTURE 下 载 方法 
RECORDING 下 载 方法 
ATTACHMENT 下 载 方法 
VIDEO 下 载 方法 
FRIENDS 添加 好 友 所 需 参数 
SYSTEM 更 新 内 容 的 用 户 或 群 聊 的 UserName 组 成 的 列表 
NOTE 通知 文本 〈 消 息 撤回 等 ) 


比如 需要 存储 有 友 送 给 目 己 的 附件 : 


@itchat.msg register (ATTACHMENT ) 
def download flles (msg): 
msg['Text"'] (msg['FileName']) 


msg 字典 的 Text 键 是 个 下 载 方法 (函数 )， 可 以 下 载 文 件 。 
再 来 看 如 何 处 理 其 他 类 型 的 消息 ， 可 以 在 消息 响应 事件 里 把 msg 打印 出 来 ， 它 是 一 个 


字典 ， 看 有 哪些 感 兴 趣 的 字段 。 下 面 演示 了 对 这 些 消 息 类 型 的 简单 处 理 。 


import itchat 
from itchat.content import * #import 全 部 消息 类 型 
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# 处 理 文本 类 消息 ， 包 括 文本 、 位 置 、 名 片 、 通 知 、 分 享 
Qitchat.msg register ([TEXT, MAP, CARD, NOTE, SHARING]) 
def text reply (msg): 
# 微 信里 的 每 个 用 户 和 群 聊 都 使 用 ID 来 区 分 ，msg['FromUserName ' ] 就 是 发 送 者 的 ID 
# 将 消 妃 的 类 型 和 文本 内 容 返 回 给 发 送 者 
itchat.send('%s: $s'"' $ (msg['Type'], msg['Text']), msg['FromUserName']) 


# 处 理 多 媒体 类 消息 ， 包 括 图 片 、 录 音 、 文 件 、 视 频 
Qitchat.msg register ([PICTURE， RECORDING, ATTACHMENT, VIDEO] ) 
def download files (msg): 
#msg['Text'] 是 一 个 文件 下 载 函 数 ， 传 入 文件 名 ， 将 文件 下 载 下 来 
msg['Text"'] (msg['FileName']) 
# 把 下 载 好 的 文件 再 发 给 发 送 者 
return Gyse5%s7 9 (PICLore" ng Video vd gensdg[L TYPe 1 ， 
'fil'), msg['FileName']) 


# 处 理 好 友 添 加 请 求 ， 收 到 好 友 邀 请 自动 添加 好 友 

Qitchat.msg register (FRIENDS ) 

def add friend (msg): 
itchat.add friend (**msg['Text']) 埋 该 操作 会 目 动 将 新 好 友 的 消息 录入 ， 不 需要 重 载 通 讯 录 
# 加 完好 友 后 给 好 友 打 个 招呼 


Itchat .send msg('Nice to meet you!', msg['RecommendInfo'] ['UserName']) 


# 处 理 群 聊 消息 ， 在 注册 时 增加 isGroupchat=True 将 判定 为 群 聊 回复 
@itchat.msg register (TEXT, isGroupChat=True) 
def text reply (msg): 
if msg['isAt']: 
itchat.send(u'@%s\u2005I recelved: %s' $ (msg['ActualNickName'], 


msg ['Content']), msg['"'FromUserName"]) 


# 在 auto login() 里 面 提供 一 个 True， 即 hotReload=True 

# 即 可 保留 登录 状态 ， 即 使 程序 关闭 ， 在 一 定时 间 内 重新 开启 也 可 以 不 重新 扫 码 
itchat .auto login (True) 

tchat runt(t) 


在 PICTURE、RECORDING、ATTACHMENT、VIDEO 几 类 的 msg 字典 的 Text 键 下 
存放 了 用 于 下 载 消息 内 容 的 函数 ， 传 入 文件 名 即 可 下 载 ， 被 上 友 送 的 文件 名 都 存储 在 msg 的 
FileName 键 中 。 

区 分 群 聊 消 息 还 是 与 好 友 聊 天 ， 在 注册 时 增加 lsGroupChat=True 将 判定 为 群 聊 回复 。 

例如 注册 @itchat.msg register(TEXT，isGroupChat=True) 将 判定 为 群 聊 回 复 ， 而 注册 
(@itchat.msg register(TEXT) 将 判定 为 与 好 友 聊 天 。 

值得 注意 的 是 ， 群 消息 增加 了 3 个 键 值 : 


isAt: 判断 是 否 6 本 号 自己 :; ActualLNickName: 实际 NickName; Content :信息 内 容 
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可 以 通过 以 下 程序 测试 : 
import itchat 
from itchat.content import TEXT 
@itchat.msg register (TEXT， isGroupChat=True) 
def text reply (msg): 
if (msg.-isAt)}): # 判 断 是 否 有 人 @ 自 己 
# 如 果 有 人 人 @ 自 己 ， 就 发 一 个 消息 告诉 对 方 已 经 收 到 了 信息 
itchat .send msg ("我 已 经 收 到 了 来 自 {0} 的 消息 ， 实 际 内 容 为 {1}".format (msg 
['ActualNickName'],msg['Text']),toUserName=msg['"'FromUserName']) 
print (msg .1sAt) # 输 出 True 或 False 
print (msg.actualNickName) 
print (msg .text) 
itchat.auto login() 


1tchat runt) 


7.3.4 ”itchat 回复 消息 


itchat 提供 了 5 种 回复 方法 ， 建 议 用 户 直 接 使 用 send0 方 法 。 
@ send0 方 法 
格式 : 


send (msg="Text Message', toUserName=None,) 


参数 : 

。 msg: 发 送 消 恩 的 内 容 ，'@fil@ 文 件 地 址 ' 将 会 被 识别 为 传送 文件 ，'@img@ 图 片 地 
址 ' 将 会 被 识别 为 传送 图 片 ，'@vid@ 视 频 地 址 ' 将 会 被 识别 为 传送 小 视频 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 目 己 。 

返回 值 : 

发 送 成 功 为 Tme， 失 败 为 False。 

程序 示例 : 

import itchat 

itchat.auto login() 

i1tehat. send({"Hello worldt!") 

# 请 确保 该 程序 目录 下 存在 gz .gif、xlsx.xlsx 和 demo .mp4 文件 

itchat.send("'@img@%®%s" % "gz.gif") 

itehate Send{("Qrile%s % "xlasx. XLS 

itchat.send('@vid@%s' $ 'demo.mp4') 


从 send_msg() 方 法 
格式 : 


Send msg(msg ex Message vy “EoUserName Nonel) 


参数 : 
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。 msg: 消息 内 容 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 友 送 给 日 己 。 
返回 值 : 

发 送 成 功 为 Tme， 失 败 为 False。 

程序 示例 : 


import itchat 
itchat.auto login() 
itchat.send msg('Hello We 


全 send_file0 方 法 
格式 : 


send flle(flleDIr，toUserName=None) 


参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
e。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 目 己 。 

返回 值 : 

发 送 成 功 为 True， 失败 为 False。 

程序 示例 : 


import itchat 
itchat .auto login() 


# 请 确保 该 程序 目录 下 存在 x1sx.xlsx 文件 


itchat.send file('xlsx.xlsx'"') 


@@ send_imsg() 方 法 
格式 : 


send img (fileDir, toUserName=None) 


参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
e。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 目 己 。 

返回 值 : 

发 送 成 功 为 Tme， 失 败 为 False。 

程序 示例 : 


itchat .send img("gz.gif") 


全 send_ video0 方 法 
格式 : 


send video (fileDir, toUserName=None) 


。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 上 自己 。 
返回 值 : 
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发 送 成 功 为 Tme， 失 败 为 False。 
程序 示例 (需要 保证 发 送 的 视频 为 一 个 实际 存在 的 MP4 文件 ): 


itchat.send file('demo.mp4') # 请 确保 该 程序 目录 下 存在 demo .mp4 文件 


7.3.5 itchat 获取 账号 


在 使 用 个 人 微 信 的 过 程 中 主要 有 3 种 账号 需要 获取 , 分 别 为 好 友 、 公众 号 、 群 聊 。itchat 
为 这 3 种 账号 提供 了 整体 获取 方法 与 搜索 方法 ， 而 群 聊 多 出 获取 用 户 列 表 的 方法 以 及 创建 
群 聊 、 增 加 和 删除 用 户 的 方法 。 这 里 分 别 介绍 这 3 种 账号 的 使 用 方法 。 

@@ 好 友 

好 友 的 获取 方法 为 get_friends(), 将 会 返回 完整 的 好 友 所 组 成 的 列表 ,其 中 每 个 好 友 为 
一 个 字典 ,列表 的 第 1 项 为 本 人 的 账号 信息 ， 如 果 传 入 update 参数 为 True， 可 以 更 新 好 友 
列表 并 返回 。 

下 面 是 某 个 好 友 的 字典 信息 : 

{'OwnerUln': 0, 'AppAccountFlag': 0, "'DisplayName': '', 'KeyWord': "'', 

'IsOwner': 0, 'EncryChatRoomId': '',，'"'NickName"': ' 富 兰 克 林 '，'UniFriend': 0， 

CDOTTESCEETS -CI MEromincer TE RmarEeY in EDRIEeR 

'UserName': 'Q@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39 

e691c88"', 'HeadImgUrl': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=636140456& 

username=@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39e691 
c88&skey=@crypt 4a30791b 8487e5all7a9ec8b72lccfdl7fe7da2f', 'Signature': 
范本 已 "PYQuanPin': "fulankelin', "Sex": 1, neElag SA ANECrSEargs = 

33788221， 'MemberCount' : 0，'VerifyFlag': 0，'RemarkName': ' 富 兰 克 林 范 本 已 '， 

'PYInitial': 'FLKL', 'RemarkPYQuUuanPin': 'fulankelinfanbenkai', 'City': '', 

Hn Meriist ConEactlist ll "AlLas "LarEeliend"- 

CnatRoomld :0 Statues < 0 "HideInpuLBarFlag: 0} 


从 中 可 以 得 到 好 友 的 省 份 (' Province ')、 用 户 ID ('UserName')、 性 别 ('Sex'", 值 1 表 
示 男 ) 等 信息 。 

好 友 的 搜索 方法 为 search_friends()， 其 有 4 种 搜索 方法 : 

1) 仅 获 取 目 己 的 用 户 信 息 


itchat .search friends () # 获 取 自己 的 用 户 信 息 ， 返 回 自己 的 属性 字典 
2) 获取 特定 UserName 的 用 户 信 息 


# 获 取 特 定 UserName 的 用 户 信息 
itchat -Search friends (userName="@abcdefgl1234567") 


3) 获取 备注 、 微 信号 、 了 昵称 中 的 任何 一 项 等 于 name 键 值 的 用 户 
# 获 取 任 何 一 项 等 于 name 键 值 的 用 户 


itchat.search friends (name="']littlecodersh'"') 
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4) 获取 备注 、 微 信号 、 了 昵称 分 别 等 于 相应 键 值 的 用 户 
# 获 取 分 别 对 应 相应 键 值 的 用 户 


itchat.search friends (wechatAccount="']littlecodersh'") 


第 3 种 和 第 4 种 方法 可 以 一 起 使 用 ， 下 面 是 示例 程序 : 

itchat .search frlends (name="'LittleCoder 机 器 人 '，wechatRAccount='1ittlecodersh') 

@ 公众 号 

公众 号 的 获取 方法 为 get mps0， 将 会 返回 完整 的 公众 号 列表 ， 其 中 每 个 公众 号 为 一 个 
字典 ， 传 入 update 参数 为 True 将 可 以 更 新 公众 号 列表 并 返回 。 

公众 号 的 搜索 方法 为 search mps()， 其 有 两 种 搜索 方法 : 

1) 获取 特定 UserName 的 公众 号 

# 获 取 特 定 UserName 的 公众 号 ， 返 回 值 为 一 个 字典 

itchat.search mps (UserName='Qabcdqefg1234567") 

2) 获取 名 字 中 含有 特定 字符 的 公众 号 

# 获 取 名 字 中 含有 特定 字符 的 公众 号 ， 返 回 值 为 一 个 字典 的 列表 

ltcaht .search mps (name="'LittleCoder') 

如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特 定 UserName 的 公众 号 ， 下 面 是 示例 程序 : 

# 以 下 方法 相当 于 仅 特 定 了 UserName 


itchat.search mps (userName="'@abcdefg1234567', name="'LittleCoder') 

图 群 黎 

群 聊 的 获取 方法 为 get_chatrooms()， 将 会 返回 完整 的 群 聊 列 表 ， 其 中 每 个 群 聊 为 一 个 
字典 ， 传 入 update 参数 为 True 将 可 以 更 新 群 聊 列表 并 返回 。 

群 聊 的 搜索 方法 为 search_chatrooms()， 共 有 两 种 搜索 方法 : 

1 ) 获取 特定 UserName 的 群 聊 

# 获 取 特 定 UserName 的 群 聊 ， 返 回 值 为 一 个 字典 

itchat.search chatrooms (userName="'@abcdefgl234567') 

2) 获取 名 字 中 含有 特定 字符 的 群 聊 

# 获 取 名 字 中 含有 特定 字符 的 群 聊 ， 返 回 值 为 一 个 字典 的 列表 

itcaht .Search chatrooms (name="'LittleCoder') 


如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特 定 UserName 的 群 聊 ， 下 面 是 示例 程序 : 
# 以 下 方法 相当 于 仅 特 定 了 UserName 


itchat.search chatrooms (userName="'@abcdefgl1234567"', name—" "LittiecCoder) 

群 聊 用 户 列 表 的 获取 方法 为 update_chatroom()， 群 聊 在 首次 获取 中 不 会 获取 群 聊 的 用 
户 列 表 ， 上 所 以 需要 调用 该 方法 才能 获取 和 群 聊 的 成 员 ， 该 方法 需要 传 入 群 聊 的 UserName， 
返回 特定 群 聊 的 用 户 列表 。 
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memberList=itchat.update chatroom('@abcdefgl234567') 


创建 群 聊 以 及 增加 、 删 除 群 聊 用 户 的 方法 如 下 ， 目 前 这 3 个 方法 都 被 严格 限制 了 使 用 


频率 ， 删 除 群 聊 需要 本 账号 为 群 管理 员 ， 人 否则 会 失败 。 


memberList=itchat .get friends () [1:] 

# 创 建 群 聊 ，topic 键 值 为 群 聊 名 

chatroomUserName=itchat.create chatroom(memberList, "test chatroom') 
# 删 除 群 聊 内 的 用 户 

itchat.delete member from chatroom(chatroomUserName, memberList[0]) 
# 增 加 用 户 进 入 群 聊 


itchat.add member into chatroom(chatroomUserName, memberList[0]) 


7.3.6 itchat 的 一 些 简单 应 用 


@ 统计 微 信 好 友 的 男女 比例 
如 果 想 统计 一 下 目 己 微 信 里 的 好 友 的 性 别 比例 ， 很 价 单 ， 获 取 好 友 列 表 ， 统 计 列 表 里 


的 性 别 计数 。 


import itchat 
itchat .login () 
# 疏 取 自己 好 友 的 相关 信息 ， 返回 一 个 好 友 列 表 
friends=itchat.get friends (update=True) [0:] 
# 初 始 化 计数 器 ， 有 男 有 女 ， 当 然 可 能 有 些 人 没 填写 性 别 
male=female=other=0 
#friends [0] 是 自己 的 信息 ， 所 以 要 从 friends [1] 开 始 
for i in friendqds[1:]:# 遍 历 这 个 列表 ， 列 表 中 的 第 1 位 是 自己 ， 所 以 从 "自己 "之 后 开始 计算 
ex 
a #1 表示 男性 ，2 表示 女性 
malet+=1 
elif sex==2: 
female+=1 
else: 
other +=1 
# 计 算 朋 友 总 数 
EoEad len(friendesila ll 
# 打 印 出 自己 好 友 的 性 别 比例 
print ("男性 好 友 : $s$.-2fS$%"g% (float (male) /total*100)+"\n"+ 
"女性 好 友 : $.2f%%"% (float (female) /total*100)+"\n"+ 
"不 明 性 别 好 友 : $.2f%%"% (float (other) /total* 100)) 


这 好 像 不 够 下 观 ， 有 兴趣 的 读者 可 以 加 上 可 视 化 展示 ,这 里 用 基于 Python 的 可 视 化 图 


像 库 Matplotlib， 首 先 安装 Matplotlib 库 : 


pip install matplotlib 
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展示 比例 一 般 使 用 百分比 圆 饼 表 : 


import numpy as np 

# 导 入 Matplotlib 库 

import matplotlib.mlab as mlab 

import matplotlib.pyplot as plt 

labels=['"'man','female"', 'unknow'"] 

X=[ male, female, otherl] 

fig=plt .figure() 

plt.pie (X, labels=labels,autopct="'%]1 .2f%%") 
# 画 饼 图 数据， 数据 对 应 的 标签 ， 百 分 数 保留 两 位 小 数 点 ) 

Bt ttlel"Pie chart™) 

Dit:Show() 

plt.savefig ("PieChart .jpg") 


其 运行 效果 如 图 7-3 所 示 。 


ES Figure 1 


Pie chart 


Man 


unknow 


x=1.00806 y=-0.75487 


图 7-3 ” 微 信 好 友 的 男女 比例 饼 图 
全 统计 微 信 好 友 的 所 在 省 份 信息 到 Excel 文件 中 


def get var (var): 
war die Il 
for 1 in friends: 
Value=1[var] 
variable .append (value) 
return variable 
# 调 用 函数 得 到 各 变量 ， 并 把 数据 存 到 csv 文件 中 
NickName=get Var ("NickName") 
Sex=get var('"Sex'") 
Province=get var('Province') 


City=get var('City') 
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Signature=get var('Signature') 
from pandas import DataFrame 
data={'NickName': NickName, '‘'Sex': Sex, '"'Province': Province, 
"itv Cv "Srgqnature- Sigqnaturel 
frame=DataFrame (data) 
Frame Eo cavt data cow ys 1ndex—Traue) 
@ 微 信 自 动 回复 
这 里 实现 一 个 类 似 QQ 上 的 自动 回复 ， 原 理 是 接收 到 消息 就 发 消息 回去 ， 同 时 发 一 条 
给 文件 助手 ， 这 样 就 可 以 在 文件 助手 中 统一 查看 消息 。 其 代码 很 简单 ， 如 下 : 
# 微 信 自 动 回 复 
import itchat 
from itchat.content import * 
# 封 装 好 的 装饰 器 ， 当 接收 到 的 消息 是 Text《〈 即 文字 消息 ) 时 
Qitchat.msg register('Text"') 
def text replyl(msg): 
# 当 消息 不 是 由 自己 发 出 的 时 候 
If not msg['FromUserName']==myUserName: 
# 发 送 一 条 提示 给 文件 助手 
itchat.send msg (u"[%s] 收 到 好 友 @%s 的 信息 : $s\n" $ 
(time.strftime ("%Y-—%m-%d %H:%M:%S", time.localtime (msg['CreateTime'])), 


msg['User']['NickName'],msg['Text']), 'filehelper') 


# 回 复 给 好 友 
returnu' [自动 回复 ] 我 现在 不 在 ,一 会 再 和 您 联系 ,\n 已 经 收 到 您 的 信息 :$s\n'% (msg['Text']) 


if name =="' main ': 
itchat.auto login() 
# 获 取 自 己 的 UserName 


myUserName=itchat.get friends (update=True) [0] ["UserName"] 
itchat runt 


@ 收 到 红包 提醒 


import itchat 
from itchat.content import * 


# 微 信 红 包 提 醒 
@itehat madg regqister{NOTE, 13GroupChat =—True) # 监 听 群 内 红包 消息 NOTE 
def receive red packet (msd) : 
if u" 收 到 红包 " in msg["'Content"']: 
groups=itchat.get chatrooms (update=True) 
users=itchat.search chatrooms (name='Happy 一 家 人 ' )# 把 红包 消息 通知 给 这 个 群 


userName=users[0]['UserName'| # 获 取 这 个 群 的 唯一 标识 ID 
For go in groups: 


if msg['FromUserName'] == gl['UserName']: 
# 根 据 群 消息 的 FromUserName [匹配 是 哪个 群 
group name=g['NickName'] # 群 的 昵称 
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msgbody=' 有 人 在 群 "ss" 发 了 红包 ,请 立即 打 电 话 给 我 ,让 我 去 抢 'sgroup_name 


# 提 醒目 己 有 人 在 群 里 发 红包 
itchat.send (msgbody,toUserName=myUserName) 
# 把 红包 消息 通知 给 'Happy 一 家 人 ' 群 
itchat.send (msgbody, toUserName=userName) 
itchat.auto login (True) 
# 获 取 自己 的 UserName 
myUserName=itchat .get friends (update=True) [0] ["UserName"] 


tehnat Tont) 


7.3.7 ”Python 调用 图 灵机 融 人 API 实现 简单 的 人 


机 交互 


图 灵机 器 人 是 一 个 中 文 语 境 下 的 对 话机 器 人 ， 免 费 的 机 器 人 人 允许 每 天 
有 5000 次 的 调用 ， 如 果 放 在 群 聊 中 是 完全 够 用 的 〈 只 有 @ 的 消息 才 使 用 机 
髓 人 回复 )。 图 灵机 器 人 还 有 一 些 简单 的 能 力 ， 例 如 讲 笑话 、 故 事 大 全 、 成 
语 接龙 、 新 闻 资 讯 等 。 如 果 有 好 友 发 送 “ 讲 个 笑话 吧 ” 它 就 会 自动 回复 一 
个 笑话 ;如 果 好 友 问 “郑州 天 气 ? ” 它 就 会 自动 回复 天 气 情况 ， 等 等 。 

下 面 介 绍 如 何 简 单 地 调用 图 灵机 器 人 接口 (API)。 

@ 注册 获取 API KEY 


这 一 步 很 简单 ， 在 “http://www.tuling123.com” 对 应 的 网 页 上 直接 注册 一 个 账号 ， 就 


视频 讲解 


可 以 得 到 目 己 的 机 器 人 API KEY。 这 个 API KEY 在 以 后 发 送 GET 请 求 的 时 候 需 要 用 到 。 


如 果 用 户 觉 得 很 县 焕 ， 也 可 以 暂时 使 用 itchat 提供 的 儿 个 KEY。 


8edce3ce905a4cldbb965e6b35c3834d 
eb720a8970964f3f855d863d24406576 
1107d5601866433dba9599faclbc0083 
71f28bf79c820df10d39b4074345ef8c 


@ 安装 requests 实现 HTTP 请 求 
在 安装 的 时 候 使 用 pip 即 可 。 


pip install requests 


全 调用 图 灵机 器 人 接口 


其 调用 也 比较 简单 ， 主 要 是 模拟 POST 请 求 ， 然 后 解析 返回 的 JSON 数据 。 用 户 可 以 
使 用 requests， 也 可 以 使 用 urllib 库 ， 但 request 简化 了 发 送 HITP 请 求 的 步骤 。 


import requests 

import urllib 

import json 

KEY="e5ccc9c7c8834ec3b08940e290ff1559" ”# 换 成 自己 的 API KEY 
url="'http://www.tulingl23.com/openapi/api' 

req info=' 讲 个 笑话 ' .encode ('utf-8') 
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query={'key': KEY, ‘info': req info)} 
headers={"'Content-type': 'text/html', ‘charset': ‘utf-8"'} 


方法 一 : 用 requests 模块 以 GET 方式 获取 回复 内 容 。 


req=requests .get (url, params=query, headers=headers) 
response=req .text 

data=]son.1loads (response) 

print (data.get ('text'"')) # 或 者 data['text"'] 


方法 二 : 用 urllib 库 获 取 回 复 内 容 。 


data=parse.urlencode (query) .encode ('utf-8' )# 使 用 urlencode () 方法 转换 标准 格式 
page=request .urlopen (url, data) 


html=page .read () 


html=html .decode ("utf-8") #decode () 将 网 页 的 信息 进行 解码 ， 否 则 会 出 现 乱码 
data=json.loads (html ) #JSON 字典 数据 

print(data) # 显 示 字 典 数据 

En AraataecgeEEexe】 # 显 示 对 话 内 容 


下 面 是 实现 在 Python 的 控制 台 下 与 图 灵机 右 人 聊天 的 例子 : 


import urllib,]Json 
from urllib import request 
from urllib import parse 
def getHtml (url, data): 
page=request .urlopen (ur]l, data) 
html=page .read () 
html=html .decode ("utf-8") ， #qdecode () 将 网 页 的 信息 进行 解码 ， 否 则 会 出 现 乱码 
return html 
if name ==' main '": 
key="8b005db5f57556fb96dfd98fbccfab84" 
#url="'http://www.tulingl23.com/openapi/api?key="' + key + '&info='+ info 
url="'http://www.tulingl23.com/openapi/api' 
while True: 
req info=input(' 我 : ') 
# 发 给 服务 器 数据 
query={'key': key, ‘info': req info} 
data=parse.urlencode (query) .encode ("utf-8°") 
# 使 用 urlencode () 方法 转换 标准 格式 


reSponse=getHtml (ar1， data) 


data=]son.1loads (response) # 字 典 数据 
print (data) # 显 示 字 典 数 据 
prinE(" 机 十 人 3 "zdatal'text"] ) # 显 示 对 话 内 容 
运行 结果 如 下 : 
我 : he 


fcCode :00000 “Cext : ' 他 "} 
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P 项 目 案例 开发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


机 器 人 说 : 他 

我 : 讲 个 笑话 

{'code': 100000，"text': "北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 
了 ， 卖 饼 的 阿姨 被 城管 吓 跑 了 '} 

机 器 人 说 : 北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 了 ， 卖 饼 的 阿姨 被 城管 古 跑 了 


7.4 程序 设计 的 步骤 


读者 掌握 了 以 上 关键 技术 ， 就 可 以 轻松 开发 微 信 机 器 人 了 。 
# 加 载 库 


from itchat.content import * 
import requests 

import json 

import itchat 


itchat.auto login() 
调用 图 灵机 器 人 的 API， 采 用 息 虫 的 原理 ， 根 据 聊 天 消 奶 返回 回复 内 容 。 


def tuling (info): 
appkey="eSccc9ci1c8834ec3b08940e290ff1559" 
url="http://www.tulingl23.com/openapi/api?key=%$s&info=%s"% (appkey, Info) 
req=requests .get (ur]1) 
content=req.text 
data=]json.loads (content) 
answer=datal"'text'"]| 


return answer 
对 于 群 聊 信息 ， 定 义 获取 想 要 针对 茶 个 群 进行 机 器 人 回复 的 群 ID 函数 。 


def group id (name) : 
df=1Echat searelt chatrooms (name—name} 


return df[0]['UserName'| 
注册 itchat 文本 消息 ， 绑 定 到 text_ replyO 处 理 函 数 。 


#text reply msg files 可 以 处 理 好 友之 间 的 聊天 回复 
Qitchat.msg regqlster ([TEXT,MAP, CARD, NOTE,SHARING]) 
def text reply (msg): 
itchat.send('%s' ss tuling (msg['Text'"']),msg['FromUserName']) 


注册 多 媒体 消息 ， 绑 定 到 download filesO 处 理 函 数 。 


@itchat | reglister ([PICTURE, RECORDING, ATTACHMENT, VIDEO]) 
def download files (msg): 
msg['Text'] (msg['FileName']) 
return ‘'@%s@%s"' $$ ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
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'fil'), msg['FileName']) 


现在 微 信用 户 通 常 加 了 很 多 群 ， 但 并 不 想 对 所 有 的 群 都 设置 微 信 机 器 人 ， 只 想 对 某 些 
群 设置 微 信 机 器 人 ， 可 进行 如 下 设置 : 

@itchat -msg register (TEXT, isGroupChat=True) 
def group text reply (msg): 

# 如 果 只 想 对 @ 自 己 的 人 回复 ， 可 以 设置 if msg['isAt'] 

item=group id(u' 想 要 设置 的 群 的 名 称 ') # 根 据 自 己 的 需求 设置 

if msg['FromUserName']==itenm: 

itchat.send(u'®%s' $ tuling (msg['Text"']), item) 


1tehnat .runt) 


这 个 机 器 人 会 自动 回复 好 友和 和 群 聊 信 息 ， 并 将 发 来 的 图 片 等 多 媒体 信息 下 载 下 来 重新 
发 给 对 方 。 


7.5 ”开发 消息 同步 机 器 人 


有 了 开发 微 信 聊天 机 器 人 的 经 验 之 后 ， 接 下 来 开发 微 信 消 姑 同 步 机 器 人 ， 微 信 消 四 同 
步 机 器 人 用 于 完成 两 个 群 信息 的 同步 〈 当 任意 一 个 群 收 到 消息 时 同步 到 其 他 另 一 个 群 )。 

其 开发 思路 是 设计 一 个 字典 groups， 用 来 存放 需要 同步 消息 的 群 聊 的 ID， 其 中 key 为 
群 聊 的 ID，value 为 群 聊 的 名 称 。 


groups={' 群 聊 的 ID' : 群 聊 的 名 称 ，' 群 聊 的 ID ': 和 群 聊 的 名 称 } 
例如 : 


groups={"@f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03fb 
b8d'，'Happy 一 家 人 ', @f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff 
208ec03fbb8d，' 神 聊 谷 '} 


当 接 收 到 和 群 聊 消息 时 ， 如 果 消 息 来 和 目 于 需要 同步 消息 的 群 聊 ， 就 根据 消息 类 型 进行 处 
理 ， 同 时 转发 到 其 他 需要 同步 的 群 聊 。 

首先 定义 一 个 消息 啊 应 函数 ， 文 本 类 消息 可 以 用 TEXT 和 SHARING 两 类 ， 使 用 
1SGroupChat=Trme 指定 消息 来 目 于 群 聊 ， 这 个 参数 默认 为 False。 


import itchat 

from itchat.content import * 

@itchat.msg register ([TEXT, SHARING], isGroupChat=True) 

def group reply text (msg): 
# 获 取 群 聊 的 ID， 即 消息 来 自 于 哪个 群 聊 
SOUTrCe=msg[ "上 FromUserName "| # 群 聊 的 ID 
# 这 里 可 以 把 source 打印 出 来 ， 在 确定 是 哪个 群 聊 后 把 群 聊 的 ID 和 名 称 加 入 groups 
groups={"'@f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03 
fbb8d'，' Happy 一 家 人 ', @f47fcf4533413b5fad998e30459a86866623c68cb6a363c7 
aeff208ec03fbb8d,，' 神 聊 谷 '} 
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P 项 目 案例 开发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


# 处 理 文 本 消息 
if msg['Type']==TEXT: 
# 消 息 来 自 于 需要 同步 消息 的 群 聊 
if source in groups:# 判 断 是 否 在 字典 里 ， 等 价 于 2.7 版 本 中 的 groups .has key (source) 
for item in groups.keys(): # 转 发 到 其 他 需要 同步 消息 的 群 聊 
if not item==source: 
#groups [source] : 消息 来 自 于 哪个 群 聊 
#msg['ActualNickName'] : 发 送 者 的 名 称 
#msg['Content']: 文本 消息 内 容 
#item: 需要 被 转发 的 群 聊 ID 
itchat.send('%s: ssSN\ngss' $ (groups[source], msg['ActualNickName'], 
msg['Content']), item) 
# 处 理 分 享 消息 
elif msg['Type']==SHARING: 
if groups.has key (source): 
for item in groups.keys () : 
if not item==source: 
#msg['Text'] : 分 享 的 标题 ,msg['Url']: 分 享 的 链接 
itchat.send('%s: ssNngssNnss' 当 (groups[source], msg['ActualNickName'], 


msg["'Text'"'], msg['Url']), item) 
再 来 处 理 一 下 图 片 等 多 媒体 类 消 忌 。 
# 处 理 图 片 和 视频 类 消息 


Qitchat.msg register ([PICTURE, VIDEO], isGroupChat=True) 
def group reply media (msg): 
Source=msg["'FromUserName "| 
# 下 载 图 片 或 视频 
msg['Text"'] (msg['FileName']) 
if groups.has key(source): 
for item in groups.keys(): 
If not item==source: 
# 将 图 片 或 视频 发 送 到 其 他 需要 同步 消息 的 群 聊 
Itchat .send('"QssQss' $ ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
'fil'), msg['FileName']), item) 
itchat.auto login (True) 


了 nEO 


以 上 代码 实现 了 对 文本 、 分 圣 、 图 片 、 视 频 4 类 消息 的 处 理 ， 如 果 用 户 对 其 他 类 型 的 
消息 也 感 兴趣 ， 进 行 相应 的 处 理 即 可 。 目 前 两 个 群 之 间 可 以 进行 消 恩 的 同步 了 了 ， 一 群 和 二 
群 的 用 户 之 间 终 于 可 以 畅快 地 聊 起 来 。 
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微 信 网 页 版 是 腾讯 公司 开发 的 微 信 官 方 工具 ， 能 够 在 计算 机 网 页 上 使 用 微 信 ， 微 信 网 
页 版 基于 Https 请 求 ， 通 过 API 的 形式 与 微 信服 务 器 进行 数据 交互 ， 所 有 的 协议 均 骏 露 ， 
可 通过 浏览 器 抓 包工 具 进行 获取 和 分 析 。 

目前 国内 流行 的 浏览 器 (例如 Chrome 浏览 器 、FireFox 浏览 器 〉 均 和 带 有 开发 者 工具 ， 
用 户 通 过 网 络 请 求 面板 可 以 详细 地 看 到 整个 微 信 网 页 版 在 运行 过 程 中 涉及 的 所 有 API 请 
求 。 本 章 根据 上 述 获 取 到 的 请 求 模 拟 微 信 网 页 版 的 流程 。 

首先 对 微 信 网 页 版 的 整体 运行 流程 进行 分 析 , 使 用 Python 语言 模拟 微 信 网 页 版 的 运行 
流程 ， 实 现 登 录 、 获 取 好 友人 信息、 发 送 消息 等 基础 操作 ， 并 在 上 述 基础 之 上 实现 一 些 扩展 
操作 ， 例 如 目 动 确认 好 友 请 求 、 定 时 发 送 消息 、 检 测 好 友 状 态 、 目 动 邀 请 好 友 加 入 和 群 聊 等 。 

通过 对 微 信 网 页 版 协议 进行 分 析 ， 读 者 对 API 中 的 请 求 参 数 、 请 求 方式 、 返 回 值 等 加 
深 了 理解 ， 这 对 后 续 的 实际 开发 有 很 多 值得 借鉴 的 地 方 ; 能 够 清晰 地 了 解 微 信 网 页 版 的 整 
体 运 行 流程 ， 扩 展 目 己 的 思维 。 男 外 ， 在 扩展 个 人 微 信 号 的 同时 也 能 很 好 地 练习 Python 基础 ， 
这 对 学 习 网 络 爬 虫 等 有 很 大 的 帮助 意义 。 


8.2 ” 微 信 网 页 版 机 器 人 设计 思路 
8.2.1 分 析 微 信和 网 页 版 API 


本 章 以 Chrome 浏览 器 为 例 讲 解 如 何 抓 包 分 析 微 信 网 页 版 API， 步 骤 如 下 : 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


@ 打开 开发 者 工具 
首先 打开 Chrome 浏览 器 ， 然 后 打开 开发 者 工具 ， 如 图 8-1 所 示 。 


人 | 昌 图 芯 
oo 


打开 新 的 标签 页 
打开 新 的 窗口 
打开 新 的 隐身 窗口 


历史 记录 
下 载 内 容 
书签 


打印 .… 
投射 … 
查找 .… 


将 页 面 存储 为 器 S 


清除 浏览 数据 ..， 全 跨 包 草 切 | 复制 | 粘贴 | 
扩展 程序 
任务 管理 器 


p 


图 8-1 打开 开发 者 工具 
切换 到 Network 界面 ， 如 图 8-2 所 示 。 


[x 6 Blements Console Sources (Networ ] Performance Memory Application Security Audits Adblock Plus -国人 
[ 外 | Ww 三 二 Group by frame Preserve log Disable cache Offine Online v 
Fitter Hide data URLs BY xHR JS CSS Img Media Font Doc WS Manifsst Other 


5 ms 10 ms 15 ms 20 ms 25 ms 30 ms 35 ms 40 ms 45 ms 50 ms 55 ms 60 ms 65 ms 70 ms 75 ms B80 ms 85 ms 90 ms 95 ms 100 ms 105 ms 1 | 


Recording network activity.， 
Perform a request or hit 器 R to record the reload 


Note: some network activity from out-of-process iframes might be missing. See http://crbug.com/750901#c4 for more details. 


图 8-2 切换 到 Network 界面 


义 选 Preserve log 复 选 框 ， 否 则 在 跳 转 之 后 无 法 查看 之 前 的 请 求 信 息 。 

提示 : 对 于 Chrome 开 友 者 工具 的 使 用 小 技巧 ， 读 者 可 以 在 网 址 “http://blog.csdn.net/ 
Letasian/article/details/78461438” 对 应 的 页 面 中 查看 。 

全 打开 微 信 网 页 版 

在 浏览 器 中 输入 网 址 (https:/wx.qq.com)， 打 开 微 信 网 页 版 。 在 左 侧 URL 列表 中 可 以 
看 到 以 jslogin 开始 的 网 址 ， 该 URL 即 为 获取 登录 所 需 二 维 码 的 API 请 求 。 

在 图 8-3 中 ， 左 侧 为 所 有 的 请 求 ， 单 击 茶 一 个 请 求 后 右 侧 会 出 现 该 请 求 的 详细 信息 。 

General 中 为 请 求 的 URL (Request URL ) 和 请 求 方式 (Request Method)， 常 见 的 请 求 
方式 有 GET 和 POST。Response Headers 为 啊 应 头 信 息 ，Request Headers 为 请 求 头 信息 ， 
包括 第 用 的 User-Agent、Host、Referer、Cookie 等 ，Query String Parameters 为 请 求 URL 
中 的 参数 信息 。 
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[x Eements Console Sources Network ”Performance Memory Apolication Security Audits Adblock Plus @1 昌国 
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Iogin?ioginicoon=trustuuid=loqsyqcSdw==Bt= 0 r=, fun: New 
lang: zh_ON 


21 requests | $57.9 KB transferred | Finish: 1.3 min | DOM.,, 


图 8-3 分析 URL 


单 击 右 侧 的 Response 标签 ， 可 以 看 到 格式 如 “window.QRLogin.code=200: window. 
QRLogin.uuid=" QZNW7IsPLe-= ":” 的 内 容 ， 其 中 window.QRLogin.code 代表 该 请 求 发 送 
成 功 ，window.QRLogin.uuid 中 的 内 容 为 当前 登录 所 需要 的 二 维 码 信息 ， 将 该 uuid 传 入 获 
取 二 维 码 的 URL 中 即 可 获取 到 二 维 码 的 图 片 。 

全 API 总 结 

根据 上 述 过 程 可 以 得 知 该 URLChttps:Wlogin.wx.qq.comyjslogin?appid=wx782c26e4c19ac 
ffb&redirect uri=https%3AY%2FY%2FWwWx.qq.com%2Fcg1-bm%2Fmmwebwx-bin%2Fwebwxnewl 
oginpage&fun=new&lane=zh CN& =1521355811687) 即 为 获取 登录 所 需 二 维 码 的 API， 请 
求 方式 为 GET， 其 中 参数 列表 中 的 appid 为 微 信 开放 平台 注册 的 应 用 的 AppID,，“” ”为 当 
前 时 间 的 13 位 毫秒 值 。 

其 余 参 数 均 固定 ， 如 下 。 

e redirect url: https://wx.qq.com/cgl-bin/mmwebwx-bin/webwxnewloginpage。 

e fun: new。 

。 lang: zh CN。 

注 : appid 就 是 在 微 信 开 放 平 台 注 册 的 应 用 的 AppID。 网 页 版 微 信 有 两 个 AppID， 早 
期 的 是 wx782c26e4c19acfftb， 在 微 信 客户 端 上 显示 的 应 用 名 称 为 Web 微 信 ; 现在 用 的 是 
wxeb7ec651dd0aefa9， 显 示 的 名 称 为 人 微 信和 网 页 版 。 

根据 上 述 分 析 ， 可 以 将 此 API 归纳 为 表 8-1。 


表 8-1 获取 登录 所 需 的 二 维 码 
描 述 获取 登录 所 需 的 二 维 码 
地 址 https://login.wx.qq.com/]slogin 
请 求 类 型 GET 
appld: Wx782c26e4c1l9acffb 
redirect uri: https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage 
请 求 参数 fun: new 
lang: zh CN 
_: 时 间 惟 
返回 值 window.QRLogin.code=200; window.QRLogn.uuid="0ZOD S53KKWw=="; 
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其 余 API 的 分 析 方 法 与 之 类 似 ， 此 处 不 再 一 一 介绍 。 


8.2.2 AP| 汇 忆 


下 面 API 列表 中 的 参数 均 为 举例 ， 在 实际 运行 中 很 多 都 是 动态 的 ， 需 要 用 户 自 定义 传 
返回 值 也 为 样 例 ， 对 于 部 分 过 长 的 有 删 减 ， 不 再 一 一 指出 。 

@ 显示 二 维 码 

显示 二 维 码 如 表 8-2 所 示 。 


> 


表 8-2 显示 二 维 码 
描述 显示 二 维 码 
地 址 https://login.weixin.qq.com/qrcode/ {uuid} 
请 求 类 型 GET 
请 求 参数 无 
返回 值 图 片 二 进 制 流 
@ 等 待 扫描 二 维 码 


等 待 扫描 二 维 码 如 表 8-3 所 示 。 


表 8-3 等待 扫 摘 二 维 码 


描述 等 待 微 信 手机 客户 端 扫 摘 二 维 码 

地 址 https://login.wx.qq.com/cgi-bin/mmwebwx-bin/login 

请 求 类 型 GET 
loginicon: true 
UUld: XXXX 

请 求 参数 tip: 0 为 未 扫描 ，! 为 已 扫 摘 
T: (-940126109)， 毫 秒 值 取 反 
_: 1494054830403， 时 间 玲 
window.code~xxx: 
xxx: 408 表示 登录 超时 ; 201 表示 扫描 成 功 ，200 表示 确认 登录 

返回 什 Es code 为 200 时 数据 包括 跳 转 地 址 ， 例 如 window.redirect_uri="https://wx2.qq. 
com/cgi-bin/mmwebwx-bin/webwxnewloginpage?ticket=AwglwtXTXfw9oQgP9]s1lV 1ig@® 
qrticket 0&uuid=4fVCtDVBOg==&lang=zh CN&scan=1494055480":”， 需 要 将 ticket 参 
数 保存 


© 登录 获取 Cookie 
登录 获取 Cookie 如 表 8-4 所 示 。 
表 8-4 登录 获取 Cookie 


描述 登录 成 功 后 获取 Cookie 信息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage 


请 求 类 型 GET 
ticket: AwglwtXTXfw9oQgP9js1VllgQqrtcket 0 
uuid: 4fVCtDVBOg== 


更 四 ]an 区 zh CN 

请 求 参 数 
scan: 1494055480 
fun: new 


version: V2 
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描 ” 述 登录 成 功 后 获取 Cookie 信息 
<eITOT> 
<ret>0</ret> 
<message></message> 
<skey>(@crypt_ 3$22d8a57 60a7646e99d8f25b230</skey> 
返回 值 <wxsid>VOXSzwUSINcrbor8</wxsid> 
<wxuin>2929094227</wxuin> 
<pass ticket>aGK4HWSoVzFoQscFt2hO%2Fy</pass ticket> 
<1sgrayscale>1</isgrayscale> 


</error> 


@ 微 信 初 始 化 
微 信 初始 化 如 表 8-5 所 示 。 


表 8-5 微 信 初始 化 


描 述 微 信 初始 化 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxinit 
请 求 类 型 POST 
数据 类 型 JSON 
请 求 头 Content-Type: application/]son; charset=UTF-8 

{ 
请 求 参 数 BaseRequest: { Uin: XXX, Sid: xxx, Skey: XXX, DevlceID: XXX } 
} 
"BaseResponse": { "Ret": 0, "EITMSsg": "" }, 
"Count": 11, 
"ContactList": |...|, 
"SyncKey": { 
"Count": 4, 
Tl | 
{ 
"Key": 1, 
"Val": 635705559 
返回 值 
] 
"User": { 
"Uin": XXX， 


"UserName": xxx, 


"NickName": XXX， 


上 
"ChatSet": XXX， 
“ey: KEE, 


续 表 
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者 


述 微 信 初始 化 
"ClientVersion": 369297683, 
"SystemTime": 1453124908, 
"InviteStartCount": 40, 
返回 值 "MPSubscribeMsgCount": 2, 
"MPSubscribeMsgList": |...|, 
"ClickReportInterval": 600000 


} 


全 开启 手机 状态 通知 
开启 手机 状态 通知 如 表 8-6 所 示 。 


表 8-6 ”开局 手机 状态 通知 


描述 开启 手机 微 信 客户 端 状态 通知 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxstatusnotify 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: appllcation/json: charset=UTF-8 
{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DevlceID: XXX }, 
Code: 3, 
请 求 参 数 FromUserName: 自己 的 ID， 


ToUserName: 目 己 的 ID， 
ClientMsgId: 时 间 惟 


} 
{ 
NE "BaseResponse": {"Ret": 0,"ErrMsg": ""}, 
返 回 数 据 "MsgID": "1848761205298770623" 
} 
@ 获取 联系 人 列表 


获取 联系 人 列表 如 表 8-7 所 示 。 
表 8-7 获取 联系 人 列表 


描 述 获取 联系 人 列表 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxgetcontact 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/]son; charset=UTF-8 
{ 
请 求 参数 BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DevicelD: xxx} 
} 
"BaseResponse": { 
"Ret": 0, 
"ErrMse": Ht 


返回 数据 天 
"MemberCount": 334, 
"MemberList": | 


"Tin"™ 0, 
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续 表 
朱 ” 述 获取 联系 人 列表 


"UserName": xxx, 
"NickName": "Urinx", 


返回 数据 . 
]， 
"9edq": 0 
} 
@ 获取 指定 联系 人 详细 信息 
获取 指定 联系 人 详细 信息 如 表 8-8 所 示 。 


表 8-8 获取 指定 联系 人 详细 信息 


描 述 获取 指定 联系 人 详细 信息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxbatchgetcontact 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/json: charset=UTF-8 


{"BaseRequest": { 
"Um": 2929094227, 
"Sid": "VOXSzwUSINcrbor8", 
"Skey": "crypt 522d8aS7 68f25b230", 
"DeviceID": "eS$86776133027541" 


$s 
"Count": 1, 
请 求 参数 "Iast | 
{ 
"UserName": "(W591768165Sac0c9b8326bbe1355", 
"EncryChatRoomld": "(9((@62ea4eba9ecd4a8111327b7cb" 
} 
] 
} 
{ 
"BaseResponse": { 
"Ret": 0, 
"Meg 
中 
"Count": 1, 
"ContactList": [ 
{ 
"Um": 0, 
返回 数据 "UserName": "(D59176816542bb0c9b8326bbe1355", 
"NickName": "路 人 甲 ", 
"HeadImgUrl": "/cgi1-bin/mmwebwx-bin/webwxgeticon?seq=0&username= 
(0591755&chatroomid=(@6a8f2&skey=", 
"ContactFlag": 0, 
} 
] 
} 
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@ 检查 新 消息 
检查 新 消息 如 表 8-9 所 示 。 


表 8-9 检查 新 消息 


描述 检查 新 消息 

地 址 https://webpush2.weixin.qq.com/cgi-bin/mmwebwx-bin/synccheck 

请 求 类 型 GET 

参数 类 型 JSON 

请 求 头 Content-Type: appllcation/json: charset=UTF-8 
{ 

请 求 参 数 BaseRequest: { Uin: xxx, S1d: xxx, Skey: XXX, DevlceID: XXX } 
} 


window.synccheck={retcode:"xxx",selector:"xxx"} 
retcode: 0 为 正常 ，1100 表示 失败 /退出 微 信 ; 1101 表示 在 其 他 地 方 登录 Web 版 微 信 ; 
1102 表示 在 手机 上 主动 退出 

selector: 0 为 正常 ，2 表示 新 的 消息 ; 6 表示 联系 人 信息 变更 ; 7 表示 进入 /离开 聊天 界面 


@ 获取 新 消息 
获取 新 消息 如 表 8-10 所 示 。 


返回 值 


表 8-10 ”获取 新 消息 


搓 述 获取 新 消息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsync 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: appllication/json: charset=UTF-8 

{ 


BaseRequest: { Uin: xxx, Sid: xxx, Skey: XXX, DevlceID: XXX }, 
请 求 参 数 SyncKey: xxx, 
IT: 时 间 戳 取 反 
} 
{ 也 aseResponse': {'ErrMseg': ", 'Ret': 0}, 
'SyncKey': { 'Count': 7, 
List: [{"Val': 636214192, 'Key': 1}, | 
}, 'ContinueFlag': 0, 
'AddMsgCount': 1, 
'AddMsgList': [{ 
'FromUserName': ", 
'RecommendInfo': {...}, 
Content: "", 


返回 值 


} 
@ 发 送 文 本 消息 
发 送 文 本 消息 如 表 8-11 所 示 。 
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表 8-11 发 送 文 本 消息 


描述 发 送 文 本 消息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsg 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: appllcation/]json: charset=UTF-8 
{ 


BaseRequest: { Uin: xxx, Sid: xxx, Skey: XXX, DevlceID: XXX }, 
Msg: { 
Type: 1 文字 消息 ， 
Content: 要 发 送 的 消息 ， 
请 求 参 数 FromUserName: 目 己 的 ID， 
ToUserName: 好 友 的 ID， 
LocalID: 与 cllentMsgId 相同 ， 
ClientMsgId: 时 间 惟 左 移 4 位 随后 补 上 4 位 随机 数 


} 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg": ""}} 


人 @ 发 送 图 片 消 息 
发 送 图 片 消 息 如 表 8-12 所 示 。 
表 8-12 发 送 图 片 消息 


摘 。 述 发 送 图 片 消 息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsgimg 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: appllcation/json: charset=UTF-8 
{ 


BaseRequest: { Uin: XXX, Sid: XXX, Skey: XXX, DevicelID: XXX }, 
Msg: { 
Type: 3 图 片 消息 ， 
Mediald: 图 片上 传 后 的 媒体 ID， 
请 求 参 数 FromUserName: 目 己 的 ID， 
ToUserName: 好 友 的 ID， 
LocalID: 与 cllentMsgId 相同 ， 
ClientMsgId: 时 间 戳 左 移 4 位 随后 补 上 4 位 随机 数 
} 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg": ""}} 
注 : 非 文本 消 轧 ， 例 如 图 片 、 语 音 、 视 频 、 表 情 等 ，API 类 似 ， 均 是 先 通 过 上 传 文件 获取 媒体 中， 
然后 发 送 此 媒体 ID。 


昌 获取 头像 
获取 头像 如 表 8-13 所 示 。 
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表 8-13 ”获取 头像 


描述 获取 头像 
地 址 https://wx.qq.com/cg1i-bin/mmwebwx-bin/webwxgeticon 
请 求 类 型 GET 
seq: 数字 
请 求 参 数 username: 用 户 ID 
Skey: XXX 
返回 值 二 进 制 


注 : 获取 好 友 、 群 头像 等 API 类 似 。 
力 获取 图 片 消息 
获取 图 片 消 息 如 表 8-14 所 示 。 

表 8-14 ”获取 图 片 消息 


描述 获取 图 片 消 息 
地 址 https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxgetmsgimeg 
请 求 类 型 GET 


msgid: 消 忆 ID 
username: 用 户 ID 


青 求 参 

请 求 参 政 type: slave 缩 略 图 ， 为 空 时 加 载 原 图 
skey: XXX 

返回 值 二 进 制 


注 ， 获取 语音 、 视 频 、 表 情 等 消息 类 似 ， 无 type 参数 。 


8.2.3 其 他 说明 


@ 账号 类 型 介绍 
账号 类 型 如 表 8-15 所 示 。 
表 8-15 账号 类 型 


类 型 说 明 
个 人 账号 以 “@” 开 涉 ， 后 面 由 32 位 数字 和 字母 组 成 
和 群 聊 以 “@Q@ ”开头 ， 后 面 由 32 位 数字 和 字母 组 成 

以 “@ ”开头 ， 但 其 VerifyFlag &8!=0 
VerlfyFlag: 
公众 号 /服务 号 一 般 个 人 公众 号 /服务 号 : 8 


一 般 企 业 的 服务 号 : 24 
微 信 官方 账号 微 信 团 队 : 56 
像 文 件 传输 助手 之 类 的 账号 ， 它 们 有 特殊 的 ID， 有 目前 已 知 的 有 filehelper、newsapp、 
fmessage、 welbo、 qqmail, tmessage、 qmessage、 qqsync、 floatbottle、 lbsapp、 shakeapp、 
特殊 账号 medianote、qqfnend、 readerapp、blogapp、facebookapp、masssendapp、meishiapp、feedsapp、 
volp 、 blogappweIxim 、 welxin 、 brandsessionholder 、 welxinreminder 、 officialaccounts 、 
notification messages、wxitil、userexperience alarm、notification messages 


例如 测试 发 送 消 息 ， 可 将 接收 人 〈ToUserName) 指定 为 filehelper (文件 传输 助手 ) 进 
行 测试 。 
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@ 消息 类 型 介绍 
微 信 中 消息 的 格式 一 般 如 下 ; 


{ 
"FromUserName™": "™", 
"ToUserName™: ™", 
1 # 内 容 
"StatusNotifyUserName": "", 
"ImgWidth": 0, 
"PlayLength™": 0, 
"RecommendInfo": {...}, 
"StatusNotifyCode": 4, 
NewMsGTG = ”> 
ll 
"VoiceLength": 0, 
“Orwarcdh ladg = 
"AppMsgType": 0， 
pe 
i hs 
ba Rd Be 
EC 
MSsoqTvype :1 
"ImgHeight": 0, 
"Mediald™: ， 
ls ee 
"FileName"™": "", 
HSEroOeL EF 
a 请 = 本 = 
"CreateTime": 1454602196, 
"SubMsgType™": 0 

} 


其 中 经 常用 到 的 字段 有 FromUserName (发 送 人 ID)、ToUserName (接收 人 ID)、Content 
(内 容 )、MsgId (消息 ID )、MsgType (消息 类 型 ) 等 。 微 信 中 的 部 分 消息 类 型 如 表 8-16 
所 示 。 

表 8-16 微 信 中 的 消息 类 型 


类 型 说 了 明 
文本 消息 

3 图 卢 消 息 
34 语音 消息 
37 好 友 确 认 消 息 
43 视频 消息 
48 位 置 消 息 
49 分 享 链接 

10000 系统 消息 

10002 撤回 消 忠 
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当 MsgType=1 时 , 用 户 只 需要 获取 Content 字段 即 可 获取 消息 内 容 , 当 MsgType=3 时 ， 
获取 Mediald 字段 ， 将 Mediald 传 入 获取 文件 接口 ， 即 可 下 载 此 图 片 消 息 。 语 音 、 视 频 等 
消息 的 获取 与 此 类 似 。 


8.3 ”程序 设计 的 步 又 
8.3.1 ”人 微 信和 网 页 版 的 运行 流程 


从 上 述 微 信和 网 页 版 API 的 分 析 过 程 可 以 得 出 微 信和 网 页 版 的 运行 流程 ， 如 图 8-4 所 示 。 


图 8-4” 微 信和 网 页 版 的 运行 流程 


(1) 打开 微 信 和 网 页 版 “https://wx.qq.com)， 获 取 随 机 的 UUID。 

(2) 根据 第 1 步 获 得 的 UUID 获取 登录 所 需 扫 摘 的 二 维 码 图 片 。 

(3) 使 用 微 信 移 动 客户 端 扫描 该 二 维 码 ， 检 测 用 户 是 否 已 经 扫 码 。 

(4) 扫 摘 二 维 码 成 功 后 ， 检 测 用 户 是 否 单 击 确认 登录 。 

(5) 确认 登录 后 ， 跳 转 新 页 面 ， 调 用 初始 化 API。 

(6) 调用 开启 手机 状态 通知 API， 获 取 联 系 人 列表 。 

(7) 循环 执行 同步 检测 ， 待 收 到 啊 应 后 继续 发 起 下 一 个 请 求 。 此 时 根据 返回 数据 的 内 
容 判 断 是 否 需 要 拉 取 消息 、 上 自动 退 出 等 操作 。 

注 : 目前 微 信 网 页 版 更 新 出 账号 记录 功能 ， 用 户 在 登录 时 可 根据 之 前 的 账号 信息 实现 
免 扫 码 ， 直 接 在 微 信 移 动 客 户 端 单 击 确认 登录 。 本 程序 未 实现 此 功能 ， 感 兴趣 的 读者 可 以 
自行 实现 。 


| 166 


第 8 音 微 信 网 页 版 协议 应 用 一 一 微 信 机 器 人 


8.3.2 ”程序 目录 


本 系统 的 程序 文件 目录 如 下 : 
六 一 Wechat bot 项 目 目录 
上 一 wechat botpy ”程序 入 口 
上 一 thread pool 线程 相关 包 
上 一 send msg thread.py 发 送 消息 线程 
上 一 Wechat 微 信 相关 包 


上 一 wechat msg processorpy 消息 处 理 

上 一 wechat.py 模拟 微 信 运行 类 〈 继 承 wechat api) 

上 一 wechat apispy ”基础 协议 (包括 所 有 API 抽象 的 函数 ) 
上 一 base ”基础 包 


上 一 confiig managerpy 读 取 配置 文件 
上 一 logpy 日志 
上 一 utilspy 党 用 工具 
上 一 constantpy 相关 常量 
上 一 wechat.confbak 基础 配置 文件 
上 一 data 运行 数据 
上 一 1001 ”机 器 人 编号 
H— Logs 日 志 
上 一 Data 文件 
上 一 msgs 消息 
上 一 users 好 友 头 像 
上 一 rooms 和 群 获 头像 
上 一 upload 上 传 文件 
注 : 本 程序 实现 了 一 台 机 器 同时 运行 多 个 微 信 机 器 人 ， 局 动 时 使 用 如 下 命令 : 
python wechat bot.py 1001 
其 中 ，1001 为 机 器 人 编号 (数字 类 型 )， 不 同 机 器 人 的 数据 位 于 不 同 的 目录 下 。 
此 时 会 根据 wechat.conf.bak 配置 文件 的 内 容 复 制 生 成 wechat 1001.conf 文件 ， 如 果 遇 
到 部 分 机 器 人 需要 修改 配置 文件 的 内 容 ， 只 需 修 改 对 应 编号 的 配置 文件 即 可 ， 不 会 影 啊 其 
他 机 器 人 。 


EA 一 一 人 em 太一 一 全 ro 
8.3.3 ”做 信 和 网 页 版 运行 代码 的 实现 
@ 获取 随机 UUID 的 代码 
获取 随机 UUID 的 函数 包括 构造 请 求 参 数 ， 使 用 Request 发 送 POST 请 求 ， 在 返回 值 
中 使 用 正则 表达 式 截取 code 和 uuid， 并 将 uuid 设置 到 变量 中 。 
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def getuuid (self): 
mm 
获取 登录 需要 的 UUID 
:return: True or False 
mm 
EP 
url=self.wx conf['API JjJsLogin'] 
params={ # 构 造 请 求 参 数 
'appid': self.appld， 
"EUun = "new 
"lang: self.wx conf [LANG"], 
"Intitime. Enet ye 
"redlrect uri': self.wx conf['API ]slogln redirect url'], 
} 


data=post (url, params, False) # 发 送 POST 请 求 
regx=r'window.QRLogin.code=(\d+); window.QRLogin.uuid=" (\S+?2)"" 
Dure search (regxz, data) # 正 则 截取 

Tn 


code=pm .group (1) 
self .uuid=pm.group (2) 
return code=="200" 
return False 
except: 


SeLF Logqerror(tracenack -tormt exet(y) 


@ 结合 grcode 生成 二 维 码 并 实现 控制 台 输 出 


使 用 qrcode 包 实 现 将 二 维 码 转化 为 黑 日 格 输出 在 控制 台 ， 如 果 IDE 为 日 色 背 景 , 需要 


将 BLACK 和 WHITE 的 内 容 互 换 。 


def genqrcode (self): 


在 控制 台 输 出 二 维 码 
:return: 
mm 
str2dqr terminal (self.wx conf['API qrcode'] + self.uuid) 
def str2qgqr terminal (text): 
qr=qrcode .QRCode () 
qr.border=1 
qr.add data (text) 
mat=qr.get matrix() 
print qr (mat) 
def print gr (mat) : 
For i An mat: 
BLACK="'\033[47m \033[0m'"' 
WHITE="\033[40m \033[0m'"' 
print('".Join([BLACK if ] else WHITE for ] in 1])) 
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注 : 因 微 信 网 页 版 的 运行 过 程 涉及 的 流程 过 多 ， 代 码 过 长 ， 此 处 不 再 一 一 列 出 ， 恋 者 
可 根据 下 面 调 度 函 数 的 执行 直接 租 看 对 应 代码 。 
全 运行 流程 调度 函数 
def start (self): 
self.Log.info(Constant.LOG MSG START) # 记 录 机 器 人 运行 


dl=datetime .now () # 启 动 时 间 
flag=True 
while True: 
d2=datetime .now () # 当 前 时 间 
d=d2 一 dl 
if d.seconds > 240: # 超 过 240 秒 未 扫 码 自动 结束 进程 
os .System (Constant .LOG MSG KILL PROCESS 当 os.getpid()) 
了 天 ELao: 


run (Constant .LOG MSG GET UUID, self.getuuid)# 获 取 二 维 码 
self.Log.info(Constant.LOG MSG GET QRCODE) # 记 录 获 取 二 维 码 


self .gengrcode () # 打 印 二 维 码 
self.Log.info(Constant.LOG MSG SCAN QRCODE) # 记 录 需 要 扫描 二 维 码 
flag=False 


dl=datetime .now () 

Em inttime Timety) 

if not self.waitforlogin (tm=tm) :# 等 待 确认 
Self.Log-lInfo (time.strftime ("%Y-%m-%d %H:%M:%S")) 


continue 


self.Log.info(Constant.LOG MSG CONFIRM LOGIN) 


break 
Pun (Constant: L0G MSG TOGIN, Self. Lodin) # 登 录 
run (Constant.LOG MSG INIT, self.webwxinit) # 初 始 化 


run (Constant.LOG MSG STATUS NOTIFY，self.webwxstatusnotify) 间 开局 状态 通知 
run (Constant .LOG MSG GET CONTACT, self.get contact) <# 获 取 联 系 人 
self.Log.info(Constant.LOG MSG CONTACT COUNT % ( 
self.MemberCount, len (self.MemberList) 
) ) # 记 录 好 友信 息 
self.Log.info(Constant.LOG MSG OTHER CONTACT COUNT % (人 
len(self.GroupList), len(self.ContactList), 
len(self.SpecialUsersList), len(self.PublicUsersList) 
) ) # 记 录 和 群 聊 、 特 殊 账 号 信息 
run (Constant .LOG MSG GET GROUP MEMBER, self.fetch group contacts)# 获 取 群 成 员 
ret=self.send text('filehelper'，" 我 上 线 了 . . .") # 发 送 上 线 消息 
self.Log.info (ret) 


Tec ey # 回 收 垃圾 
self.Log.info("groups number: %d" $ len(self.GroupList)) 
self.init thread () # 初 始 化 线程 
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while True: 
[retcode，selector]=self.synccheck() # 检 测 新 消息 
self.Log.debug ("tag:%s, retcode: %s, selector: %s" 委 (SelLt.tag， 
retcode, selector)) 
selFeexit code mtireteeode) 
if retcode=="1100"': 
self.Log.info(Constant .LOG MSG LOGOUT ) 
break 
1f retcode=="1101"': 
self.Log.info(Constant.LOG MSG LOGIN OTHERWHERE) 
break 
1f retcode=="'1102': 
self.Log.info(Constant.LOG MSG QUIT ON PHONE) 
break 
elif retcode=="'0"': 
if selector=="'0': 
time.sleep (self.time out) 
else: 
r=self .webwxsync () # 获 取消 息 
if r is not None : 
PE 
self.handle mod(r) # 处 理 联系 人 变更 
self.handle msg (r) # 处 理 消息 
except Exception as ex: 
self.Log.1info(r) 
self .Log.error(traceback.format exc()) 


elses # 未 知 状 态 


r=Sself .webwxsync () 


self.Log.debug('sync check error webwxsync: %s\n' $ json.dumps (r)) 


8.4 扩展 功能 
8.4.1 自动 回复 


自动 回复 分 为 关键 词 回 复 和 普通 话语 回复 ， 实 现 逻辑 是 在 程序 启动 时 初始 化 关键 词 字 
典 ， 其 中 key 为 关键 词 内 容 进行 md5 加 密 ，value 为 要 回复 的 内 容 。 当 收 到 好 友 消息 后 ， 
在 关键 词 字典 中 检测 是 否 有 对 应 的 键 ， 若 存在 ， 则 自动 回复 该 内 容 ， 对 于 不 在 关键 词 中 的 
话语 ， 则 将 好 友 发 送 的 话语 作为 内 容 ， 调 用 第 三 方 机 器 人 获取 返回 值 进行 回复 。 
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本 程序 使 用 图 灵机 器 人 的 API 实现 对 话 ， 对 于 图 灵机 器 人 的 相关 内 容 ， 请 读者 查看 其 
官方 文档 ， 网 址 为 “https://www.kancloud.cn/turing/web api/522989”。 
@ 初始 化 关键 词 字典 
self.keyword reply=t # 初 始 化 关键 词 
get md5 value ("你 好 ") : "我 很 好 ， 你 呢 ? "， 
get md5 value (" 你 是 谁 ") : "我 是 可 爱 的 GeekBot!",， 
} 


注 : 本 程序 直接 初始 化 了 字典 ， 在 实际 开发 中 为 了 方便 管理 可 使 用 数据 库 管 理 。 
@ 封装 调用 图 灵机 器 人 API 函数 


def call tuling(self, text, user id=None): 


mmnm 
调用 图 灵机 器 人 
:param text: 消息 内 容 
:param user id: 用 户 唯一 标识 ， 用 于 上 下 文 
:return: 回复 的 内 容 
mam 
msg={ #RAPI 所 需 参 数 
'key': Constant .TULING API KEY, #key 
no EX 二- # 内 容 
'userid': user id ”# 用 户 唯一 标识 
} 
res=post (Constant .TULING API URL, msg) 
0 
TEonEtresT od 0o00n0 
return res['text'"]| 
elif int (res['code'])==200000: 
return res['text"'] + '\r' + res['url'] 
else: 


return res['text'"']| 


= = # 异 和 常 
return Constant .TULING NOT RES #' 我 不 知道 你 在 说 些 什么 ， 换 个 话题 吧 ...' 
全 自动 回复 实现 


if get md5 value (content) in self.wechat.keyword replLy:# 判 断 是 否 存在 该 关键 词 
text Selft wechat keyaord replylhget mo value(eontencn 
elif content.startswith('msgs/"'): 
text=' 天 哪 ， 我 还 不 能 处 理 非 文 本 消 因 ~' 
else: # 不 存在 调用 图 灵机 器 人 API 
text=self.call tuling(content, get md5 Value (user['NICcKName']) ) 
data={ 
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“msgType”: 1, 
"data": text 
} 
t=random.uniform(1, 4) # 随 机 休眠 一 定 的 时 间 再 回复 
time.sleep (七 ) 
self.send msd(dqata，uUser['UserName']) # 发 送 消 息 
self.Log.info('to:%s,send:%s' $ (user['NickName']，text)) # 记 录 发 送信 息 


@ 发 送 文本 消息 函数 


def webwxsendmsg (self, word, to='filehelper'): 
mmnm 
发 送 消息 
:param word: 消息 内 容 
:param to: 接收 人 ID 
:return: Dict or None 


dic=None 

flag=0 

while flag < 2: <# 出 错 会 进行 一 次 重 发 
EE 


url=self.wx conf['API webwxsendmsg'] + \ 
'?pass ticket=%s' $ (self.pass ticket) 
clientMsgId=str(int (time.time() * 1000)) + \ 
Str{(random: randomt}})[l:sl=replace( 一 >) 
params={ 
"BaseRedquest ' : self.get base request () ， 
"Ma = 
EYOU 
“Conent” > word, 
"FromUserName": self.User[l'UserName'], 
"ToUserName": to, 
"LocalID": clientMsgIdqd, 
"ClientMsgId": clientMsgId 
} 
"Scene ' : 0 
} 
headers={'content-type': "applLicatlon/]sony charset=UTF-8"'} 
return post (url, params, True, headers) 
except: 
1 
self.Log.info (dic) 
flag=flag + 1 
self.Log.error(traceback.format exc()) 


return None 
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其 实现 效果 如 图 8-5 所 示 。 


“郑州 : 周 日 04 月 01 日 ,多 云 转 
晴 南 风 微风 ,最 低 气 温 14 
度 ， 最 高 气温 30 度 


图 8-5 目 动 回复 演示 


8.4.2 群发 消息 、 定 时 发 送 消息 、 好 友 状 态 检测 


对 于 个 人 微 信 用 户 而 言 ， 在 节日 时 经 利 会 群发 消息 ， 可 是 千篇一律 的 祝福 不 仅 无 法 体 
现 出 心意 ， 反 而 会 让 接收 者 厌烦 ， 但 一 个 一 个 发 送 又 太 过 烦 开 ， 本 程序 实现 的 群发 消息 可 
根据 接收 者 昵称 或 备注 目 动 填 充 , 做 到 发 送 的 每 一 条 消息 都 不 一 样 , 接收 者 也 更 容易 接收 。 
定时 发 送 消 妃 的 需求 主要 为 目 动 报时 ， 防 止 因 长 时 间 没 有 消息 被 微 信 认为 挂机 而 强制 
下 线 等 ， 一 般 可 通过 此 方法 延长 机 器 人 的 运行 时 长 。 
在 群发 消息 时 ， 符 遇 到 好 友 状 态 异 利 ， 例 如 拉 黑 或 删除 等 ， 微 信 会 发 送 系 统 消 轧 ， 提 
示 该 好 友 状 态 异 第 ， 此 时 可 通过 检测 微 信 返回 消息 ， 并 给 异 第 好 友 不 同 的 备注 来 实现 好 友 
状态 检测 功能 。 
注意 : 在 群发 消息 时 需要 注意 发 送 频率 , 编者 经 过 几 次 测试 , 发 现 有 10 个 好 友 , 在 1 一 
4 秒 时 间 段 随机 取 一 个 时 间 进 行 休眠 , 连续 12 小 时 发 送 文 本 消息 未 出 现 因 发 送 频繁 被 限制 
发 送 的 情况 ， 因 此 本 程序 限制 随机 时 间 为 1 一 4 秒 。 文 件 消 息 需 延长 此 时 间 ， 可 以 通过 配置 
文件 修改 文本 消息 休眠 时 长 。 
@ 发 送 消息 线程 
def process (self): 
text="Never lie to someone who trust you. Never trust someone who lies 
Eo you Los 


for contact in self.wechatContactList: 
天 Se .wechat Send texzt {lcontactl UserName ls texzt YS contact['NickName']) 
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注意 : 在 好 友 多 的 情况 下 ， 和 群发 消息 因为 需要 休眠 比较 耗 时 ， 一 般 采 用 多 线程 实现 群 


Self.wechat .Log.info("send msg to:%s,text:%s" 当 (contact['NickName'], 
text $$ Contactl NickName"lil) 
t=random.uniform(1, 4) 
time.sleep (t) # 随 机 休眠 一 段 时 间 ， 避 免 微 信 认为 操作 违法 
# 每 小 时 回 文件 助手 发 送 一 个 消息 ， 避 免 长 时 间 无 操作 被 微 信 认为 挂机 ， 从 而 强制 下 线 
current minutes=int (get now time('%M"')) 
if current minutes==59: 
self.wechat.send text('filehelper'，' 主 人 主人 ,为 您 报时 ,当前 时 间 :%s' S 
get now time()) 


time.sleep (60) 


发 ,避免 影响 主线 程 同步 消息 断 开 。 在 实际 开发 中 , 发 送 消 息 任 务 一 般 通 过 redis 等 消息 队 
列 通知 发 送 消 息 内 容 ， 机 器 人 获取 到 之 后 进行 发 送 。 
从 发 送 结果 


群发 消息 演示 如 图 8-6 所 示 。 
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图 8-6 ”群发 消息 演示 


注意 : 为 避免 给 好 友 带 来 骚扰 ， 上 述 代 码 中 调用 发 送 函数 的 语句 已 注释 ， 通 过 Log 打 
印 要 发 送 的 消息 展示 发 送 结 果 。 

全 好 友 状 态 检 测 

SYS BLACK LIST CONTRACT= ' 消 息 已 发 出 ， 但 被 对 方 拒 收 了 。， 

SYS_DELETE CONTRCT=' 开 局 了 朋友 验证 ， 你 还 不 是 他 《〈 她 ) 朋友 。 请 先 发 送 朋友 验证 请 求 ， 

对 方 验证 通过 后 才能 聊天 ' 

If msg['MsgType']==self.wechat .wx conf['MSGTYPE SYS']: 
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if content==Constant.SYS BLACK LIST CONTACT: # 黑 名 单 

res=self .wechat .webwxoplog (msg[ FromUserName "|], 

remark name= 'A- 拉 黑 -%s' 当 user['NickName']) 

self .wechat .Log.info('[ 黑 名 单 ] 给 $s 设置 备注 :ss's(user['NickName'] ，res) ) 
elif Constant.SYS DELETE CONTACT in content: # 被 删除 好 友 

res=self .wechat .webwxoplog (msgl[ "FromUserName" |]， 

remark name= 'A- 删 除 -%s' % user['NickName']) 

self .Log.info(' [删除 好 友 ] 给 $s 设置 备注 :ss' % (user['NickName'],， res)) 
elf content startaswithlConstant: SY ACCESS VERIFY INFO STAR 下 入 > 

# 新 添加 好 友 
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data=t{ 
"msgType": 1, 
"data": '$%s 你 好 ， 终 于 等 到 你 ~' % user['NickName'] 
} 
SELF send mgq(datar Userl UserNames |) 
self .Log.info(' [新 增 好 友 ] 给 $s 发 送 欢 迎 语 ' gs (user['NickName'])) 


8.4.3 ”自动 邀请 好 友 加 入 群 聊 


对 于 一 些 公司 或 个 人 的 特殊 需求 ， 需 要 根据 某 些 属性 自动 邀请 用 户 进 入 不 同 的 群 聊 ， 
例如 华中 区 、 华 南 区 等 ， 此 时 需要 机 器 人 根据 用 户 发 送 的 特殊 指令 + 关键 词 ( 例 如 我 要 入 
群 + 华中 ) 自动 查询 所 属 的 群 聊 ， 然 后 给 该 用 户 发 送 入 群 链接 ， 并 引导 用 户 单 击 加 入 。 

程序 设计 包括 好 友 消 息 分 析 、 关 键 词 和 群 聊 对 应 关系 、 自 动 发 送 入 群 邀请 、 自 动 发 送 
提示 语句 等 ， 具 体 如 下 : 

@ 初始 化 关键 词 和 群 聊 对 应 关系 


self.enter group keyword={ # 自 动 入 群 关键 词 和 和 群 聊 对 应 字典 
和 工种 所 
"2 群 ': ' 测 试 2 和 群 '， 
} 


@ 根据 群 名 查找 群 聊 


def get group by name (self, name): 
for member in self.GroupList: 
JET NickName ll name: 
return member 
return None 


} 
@ 更 新 群 黎 API 函数 


def webwxupdatechatroom(self, room user name, add arr="", del arr="", 
invite arr="", topic=None): 
flag=0 
dic=None 
while flag < 2: 
Le 
params—1 
"BaseRequest": self.get base request () ， 
'ChatRoomName': room user name 
} 
base url=self .wx conf['"API webwxupdatechatroom'] + "?fun=$%s" 
if invite arr: # 发 送 入 群 邀请 链接 
url=base url $ 'invitemember'"' 


params['InviteMemberList"']=invite arr 
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elif add arr: # 直 接 添加 进 群 
url=base url %$% “addmembper 
params['AddMemberList"']=add arr 
elif del arr: # 删 除 群 成 员 
ri aseurli se delmemmer, 
params['DelMemberList"']=add arr 
elif topic: 音 修 改 群 名 
url=base url $ ‘'modtopic'" 
params['NewTopic']=topic 
headers={'"'content-type': 'application/jJson; charset=UTF-8"'} 
url += '"'&lang=zh CN&pass ticket="' + self.pass ticket 
dic=post (url, params, True, headers) 
#Ret 0 成 功 
# -11-2 失败 ”和 群 开启 群 主 验证 
# ”1205 ”失败 ”操作 频繁 
1if dic['BaseResponse']['Ret']!= 0: 
group=self.get group by id(room user name) 
self .Log.error(' [$s] 更 新 群 聊 失败 ,错误 代码 :$s，, 错误 原因 :%s' % 
(group['NickName'], dic['BaseResponse']['Ret"'], 
dic['BaseResponse']['ErrMsg'])) 
self.Log.infol(str (dic)) 
return dic['BaseResponse']['Ret']== 
except: 
flag=flag+l 
i ee 
self.Log.info (dic) 
self .Log.error (traceback.format exc () ) 
return False 


@ 好 友 消 息 分 析 
#Constant .STRING ENTER GROUP KEYWORD=' 我 要 入 群 +， 
if Constant.STRING ENTER GROUP KEYWORD in content: # 关 键 词 入 群 
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keyword=content .split (Constant.SsSTRING ENTER GROUP KEYWORD) [1] 
# 在 关键 词 列表 中 查找 所 属 群 
room name=self.wechat.enter group keyword[keyword] if keyword in self 
-wechat .enter group keyword else None 
remind msg=Constant.STRING ENTER GROUP NOT FOUND  ”# 换 个 关键 词 试 试 
if room name: 
group=self .wechat .get group by name (room name) 
uF oroup: 
res=self .wechat .webwxupdatechatroom(group['UserName'], jinvite arr 
=usSer['UserName"|]) 


下 


remind msg=Constant .STRING ENTER GROUP SUCCESS# 邀 请 链接 进 群 
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else: 
remind msg=Constant .STRING ENTER GROUP UNKNOWN ERROR# 出 错 

data={ 

mgtvoe = 1 

"data": remind msg 
} 
t=random.uniform(1, 4) 
time.sleep (七 ) 
self.send msg (data, userl'UserName"]) 


self.Log.info('to:%s,send:%s' % (user['NickName'], remind msg))} 


其 实现 效果 如 图 8-7 所 示 。 


0.14% OD! © ll Nl 85 


GeekBot 


党 。 洲 请 你 加 入 群 了 
GeekBot" 洲 请 你 可 入 群 聘 ; 则 试 总 


群 ， 进 入 可 查看 详情 mm 


回国 国 请 名 目 流 请 链接 进 群 上 


委 党 便 
A 
计 英 


汪 换个 关键 词 试 试 吧 … 


)) ) 名) (十 ) 


图 8-7 目 动 发 送 入 群 邀 请 
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9.1 二 维 码 介绍 


二 维 码 (二 维 条 码 ) 是 指 在 一 维 条 人 码 的 基础 上 扩展 出 的 男 一 维 具 有 可 读 性 的 条 码 ， 使 
用 黑白 矩形 图 案 表 示 二 进 制 数 据 ， 被 设备 扫描 后 可 获取 其 中 所 包含 的 信息 。 一 维 条 码 的 宽 
度 记 载 着 数据 ， 而 其 长 度 没 有 记载 数据 。 二 维 条 码 的 长 度 、 宽 度 均 记载 着 数据 。 二 维 条 人 码 
有 一 维 条 人 码 没 有 的 “定位 点 ”和 “容错 机 制 ”。 容 错 机 制 使 得 在 即使 没有 辨识 到 全 部 的 条 人 码 
或 者 条 人 码 有 污 损 时 也 可 以 正确 地 还 原 条 人 码 上 的 信息 。 二 维 码 的 种 类 很 多 ， 不 同 的 机 构 开 发 
出 的 二 维 码 具有 不 同 的 结构 以 及 编写 、 读 取 方 法 。 

@ 堆 和 瑚 式 一 维 码 

堆 琶 式 二 维 码 例如 PDF417〈 证 件 及 卡片 等 大 容量 、 高 可 靠 性 信息 目 动 存储 、 携 市 并 
可 用 机 器 自动 识别 )、Code49、Codel16K、Ultracode 等 。 

四 矩阵 式 一 维 码 

定 阵 式 二 维 码 例如 QR 码 、Code One、Aztec、Data Matrix 等 。 

本 章 使 用 的 二 维 码 是 QR Code (Quick Response Code )， 学 名 为 快速 啊 应 矩阵 码 ， 它 是 
二 维 条 人 码 的 一 种 。QR 二 维 码 目前 在 很 多 地 方 有 着 广泛 的 应 用 ， 例 如 通过 微 信 二 维 码 加 好 
友 、 将 应 用 软件 的 下 载 地 址 做 成 二 维 码 , 等 等 -QR 二 维 码 是 于 1994 年 由 日 本 的 Denso-Wave 
公司 发 明 的 。QR 是 英文 Quick Response 的 缩写 ， 即 快速 响应 的 意思 ， 源 自发 明 者 希望 QR 
码 可 让 其 内 容 快 速 被 解码 。QR 二 维 码 比 普 通 条 人 码 可 储存 更 多 资料 ， 也 无 须 像 普 通 条 码 那 
样 在 扫描 时 需要 直线 对 准 扫 摘 器 。 

QR 码 呈 正方 形 ， 只 有 黑 、 白 两 色 ， 在 3 个 角落 印 有 较 小 、 像 “ 回 ” 字 的 正方 形 图 案 。 
这 3 个 图 案 是 帮助 解码 软件 定位 的 图 案 ， 用 户 不 需要 对 准 ， 无 论 以 何 角 度 扫描 ， 数 据 仍 可 
被 正确 读 取 。 

QR 二 维 码 的 结构 如 下 。 
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(1) 版 本 信息 : versionl (21x21)，version2，…，version40， 一 共 40 个 版 本 。 有 版 本 代 
表 每 行 有 多 少 码 元 模块 ， 每 一 个 版 本 比 前 一 个 版 本 增加 4 个 人 码 元 模块 ， 计 算 公 式 为 (n-1)x 
4+21， 每 个 码 元 模块 存储 一 个 二 进 制 0 或 者 1， 黑 色 模 块 表示 二 进 制 “1”， 白 色 模 块 表示 
二 进 制 “0”， 例 如 version1 表示 每 一 行 有 21 个 公元 模块 。 

(2) 格式 信息 : 存储 容错 级 别 有 工 (7%)、M (15%)、Q (25%)、R (35%)。 容 错 指 
允许 存储 的 二 维 码 信息 出 现 重 复 部 分 ， 级 别 越 高 ， 重 复 信 息 所 占 的 比例 越 高 。 其 目的 是 即 
使 二 维 码 被 图 标 遮 住 一 部 分 ， 一 样 可 以 获取 全 部 二 维 码 内 容 。 有 图 片 的 二 维 码 ， 图 片 不 算 
二 维 码 的 一 部 分 ， 它 遮 住 一 部 分 码 元 ， 但 还 是 可 以 扫描 到 所 有 内 容 。 

(3) 数据 和 纠 错 码 字 : 实际 保存 的 二 维 码 信息 和 纠 错 码 字 〈 用 于 修正 二 维 码 损坏 让 来 
的 错误 ， 也 就 是 说 当 码 元 被 图 片 庶 住 时 可 以 通过 纠 错 码 字 来 找 回 )。 

(4) 位 置 探测 图 形 : 用 于 对 三 维 码 的 定位 。 位 置 探测 图 形 用 于 标记 和 窍 形 大 小 ，3 个 图 
形 确定 一 个 矩形 。 

上 述 二 维 码 结构 信息 按照 一 定 的 编码 规则 变 成 二 进 制 ， 通 过 黑 、 白 色 形 成 从 形 。 

除了 标准 的 QR 码 之 外 ， 还 存在 一 种 称 为 “微型 QR 码 ” 的 格式 ， 它 是 QR 人 码 标准 的 
缩小 版 本 ， 主 要 是 为 了 无 法 处 理 较 大 型 扫描 的 应 用 而 设计 。 微 型 QR 码 同样 有 多 种 标准 ， 
最 多 可 存储 35 个 字符 。 


9.2 二 维 码 生成 和 解析 关键 技术 
9.2.1 grcode 库 的 使 用 


@ 安装 qrcode 库 

如 果 要 用 Python 生成 二 维 码 ， 诈 先 需要 下 载 Python 的 二 维 码 库 qrcode。qrcode 库 是 
用 于 生成 二 维 人 码 图 像 的 Python 第 三 方 库 。 

qrcode 二 维 码 生成 包 的 安装 如 下 《在 命令 行 cmd 中 ): 


C:\> pip install grcode 


但 看 qrcode 库 的 安 疫 信息 ， 如 图 9-1 所 示 。 


C:\> pip show gqrcode 


管理 员 : C:\Windows\system32\cmd.exe 


:0de image generator 
e: https://github.com/lincolnloop/python—-qarcode 
Author: Lincoln Loop 
Author-email: info@lincolnloop.com 


Location: d: python\python35-—32、\1lib\site—packages 
;ix 


Requires: si 


图 9-1 查看 qrcode 库 的 安装 信息 
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人 生成 二 维 码 

导入 grcode 模块 后 ，make0 函 数 返 回 一 个 grcode.image.pil.PilImage 对 象 ， 调 用 make() 
限 数 生成 一 个 二 维 人 码 图 片 对 象 ， 如 图 9-2 所 示 ， 最 后 调用 图 片 对 象 的 save() 函 数 就 可 以 将 
生成 的 二 维 人 码 保存 下 来 。 代 人 码 如 下 : 

import qrcode 


img=qrcode.make ("http://www.zut.edu.cn") 


img.save ("xinxing .png") 


图 9-2 生成 的 二 维 码 图 片 xinxing.png 


上 和 面 是 按照 qrcode 默认 的 方式 生成 二 维 码 ， 如 宁 硕 望 生成 不 同 斥 寸 的 二 维 码 ， 则 需要 
使 用 QRCode 类 ， 如 下 : 

QRCode (version=None, error correction=constants.ERROR CORRECT M, box size=10, 

border=4, image factory=None) 

version 表示 二 维 码 的 版 本 号 ， 二 维 码 总 共有 1 一 40 个 版 本 ， 最 小 的 版 本 号 是 1， 对 应 
的 尺寸 是 21X21, 每 增加 一 个 版 本 会 增加 4 个 尺寸 ,这 里 所 说 的 尺寸 不 是 生成 图 片 的 大 小 ， 
而 是 指 二 维 码 的 长 宽 被 平均 分 为 多 少 份 。 

error_correction 指 的 是 纠 错 容量 ， 这 就 是 为 什么 二 维 码 上 面 放 一 个 小 图 标 也 能 扫 出 来 
的 原因 ， 纠 错 容量 有 4 个 级 别 ， 分 别 如 下 。 

。 ERROR CORRECT LEL 级 别 : 7% 或 更 少 的 错误 能 修正 。 

。 ERROR CORRECT M M 级 别 : 15% 或 更 少 的 错误 能 修正 , 也 是 qrcode 的 默认 级 别 。 

。 ERROR CORRECT QQ 级别: 25% 或 更 少 的 错误 能 修正 。 

e。 ERROR CORRECT HH 级别: 30% 或 更 少 的 错误 能 修正 。 

box_size 指 的 是 生成 图 片 的 像素 。 

border 表示 二 维 码 的 边框 宽度 ，4 是 最 小 值 。 

image factory 参数 是 一 个 继承 于 grcode.image.base.BaseImage 的 类 ， 用 于 控制 make 
image() 冰 数 返回 的 图 像 实 例 。image_factory 参数 可 以 选择 的 类 保存 在 模块 根 目 录 的 Image 
文件 夹 下 。imasge 文件 夹 里 面 有 5 个 .py 文件 ， 其 中 一 个 为 ”init _.py, 一 个 为 base.py， 还 
有 pilpy (提供 了 默认 的 grcode.image.pil.PilImage 类 )、pure.py( 提 供 了 grcode.image 
.pure.PymagingImage 类 )、svg.py (提供 了 SvegFragmentImage、SvgImage 和 SvgPathImage 
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几 个 类 )。 

注 : 实际 上 ，make0 函 数 也 是 通过 实例 化 一 个 QRCode 对 象 来 生成 二 维 人 码 的 。 在 调用 
make() 的 时 候 也 可 以 传 入 初始 化 参数 。 

例子 如 下 : 


import qrcode 
qr=qrcode .QRCode ( 
version=]1, 
error correction=qrcode.constants .ERROR CORRECT LL, 
box size=10, 
border=4, 
) 
qr.add data('http://www.zut.edu.cn') 
qr.make (fit=True) 
img=qr .make lmade () 


img.save('xinxingzhao.png') 


说 明 : QRCode 对 象 的 make image0 函 数 可 以 通过 改变 人 ll color 和 back color 参数 来 
改变 所 生成 图 片 的 背景 闫 色 和 格子 颜色 。 
全 生成 其 他 类 型 的 二 维 码 
用 户 可 以 将 二 维 码 图 片 转化 为 SVG (矢量 图 )。qrcode 可 以 生成 3 种 不 同 的 SVG 图 像 ， 
一 种 是 用 路 径 表 示 的 SVG， 一 种 是 用 矩形 集合 表示 的 完整 SVG 文件 ， 还 有 一 种 是 用 和 矩形 
集合 表示 的 SVG 片段 。 第 1 种 用 路 径 表 示 的 SVG 其 实 就 是 矢量 图 ， 可 以 在 图 像 放 大 的 时 
候 保 持 图 片 质量 ， 而 另外 两 种 可 能 会 在 格子 之 间 出 现 空 隐 。 
这 3 种 分 别 对 应 了 svg.py 中 的 SvgPathImage、SvgImage 和 SvgFragmentImasge 类 。 在 
调用 qrcode.make() 函 数 或 者 实例 化 QRCode 时 当 作 参数 传 入 就 可 以 了 。 
另外 还 有 qrcode.image.svg.SvgFillImage 和 grcode.img.svg.SvgPathFillImage, 分 别 继 承 
自 SvgImage 和 SvgPathImage。 这 两 个 并 没有 其 他 改变 ， 只 不 过 是 默认 把 背景 颜色 设置 为 
白色 而 已 。 
import qrcode 
import qrcode.image.svg 
if method=="'basic'"': 
# 人 简单 的 工厂 ， 只 有 一 套 
factory=qrcode.image.svg.SvgImage 
elif method=="'fragment': 
# 雄 片 工 厂 〈 也 只 是 一 组 第 形 ) 
factory=qrcode.image.svg.SvgFragmentImage 
else: 
# 组 合 路 径 工 三， 修复 缩放 时 可 能 出 现 的 空白 
factory=qrcode.image.svg.SsSvgPathImage 


Img=qrcode .make ('xinxingzhao', image factory=factory) 
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9.2.2 ”PIL 库 的 使 用 


生成 二 维 码 图 像 同时 依赖 于 PIL 库 ，PIL (Python Imaging Library， 图 像 处 理 类 库 ) 所 
供 了 通用 的 图 像 处 理 功 能 ， 以 及 大 量 有 用 的 基本 图 像 操 作 ， 例 如 图 像 的 缩放 、 裁 前、 旋转 
和 颜色 转换 等 。PIL 是 Python 语言 的 第 三 方 库 ， 安 装 PIL 库 的 方法 如 下 ， 需 要 安装 的 库 的 
名 字 是 pillow。 

C:\> pip install pillow 或 者 pip3 install pillow 


PIL 库 文 持 图 像 的 存储 、 显 示 和 处 理 ， 能 够 处 理 几 乎 所 有 图 片 格式 ， 可 以 完成 对 图 像 
的 缩放 、 剪 裁 、 三 加 以 及 回 图 像 添加 线条 和 文字 等 操作 。 

PIL 库 主要 实现 图 像 归 档 和 图 像 处 理 两 方面 的 功能 需求 。 

。 图 像 归 档 : 对 图 像 进 行 批 处 理 、 生 成 图 像 预览 、 转 换 图 像 格 式 等 。 

。 图 像 处 理 : 图 像 的 基本 处 理 、 像 素 处 理 、 颜 色 处 理 等 。 

根据 不 同 功能 ，PIL 库 共 包括 21 个 与 图 像 相关 的 类 ， 这 些 类 可 以 被 看 作 是 子 库 或 PIL 
库 中 的 模块 ， 各 模块 如 下 : 

Image 、JImageChops 、 ImageCrackCode、ImageDraw、 ImageEnhance 、 ImageFlle 、 
ImageFilelO、 ImageFilter、 ImageFont、 ImageGrab、 ImageOps、 ImagePath、 ImageSequence、 
ImageStat、ImageIk、ImageWin、PSDraw 

下 面 介绍 几 种 最 第 用 的 模块 。 

OO Image 模块 

Image 模块 是 PIL 中 最 重要 的 模块 ， 它 提供 了 诸多 图 像 操 作 功能 ， 例 如 创建 、 打 开 、 
显示 、 保 存 图 像 等 功能 ， 合 成 、 裁 前 、 滤 波 等 功能 ， 获 取 图 像 属 性 等 功能 。 

PIL 中 的 Image 模块 提供 了 Image 类 ， 用 户 可 以 使 用 Image 类 从 大 多 数 图 像 格 式 的 文件 中 
读 取 数 据 ， 然 后 写 到 最 常见 的 图 像 格 式 文件 中 。 如 果 要 读 取 一 幅 图 像 ， 可 以 使 用 以 下 代码 : 


from PIL import Image 


pil im=Image.open('empire.]Jpg') 


上 述 代 码 的 返回 值 pil im 是 一 个 PIL 图 像 对 象 。 
用 户 也 可 以 直接 使 用 Image.new(mode,silze,color 二 None) 创 建 图 像 对 象 ，color 的 默认 值 
是 黑色 。 


newIm=Image.new('RGB', (640, 480), (255, 0, 0)) # 新 建 一 个 Image 对 象 
这 里 新 建 了 一 个 红色 背景 、 大 小 为 〈640, 480) 的 RGB 空白 图 像 。 


图 像 的 颜色 转换 可 以 使 用 Image 类 的 convert0 方 法 来 实现 。 如 果 要 读 取 一 幅 图 像 ， 并 
将 其 转换 成 灰 度 图 像 ， 只 需要 加 上 convert(I) 即 可 ， 例如 : 


pil Im=Image .open ('emplre.]pg') .convert('L') # 转 换 成 灰 度 图 像 


从 ImageChops 模块 
ImageChops 模块 包含 一 些 算术 图 形 操作 ， 即 channel operations("chops")。 这 些 操作 可 
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用 于 诸多 目的 ， 例 如 图 像 特效 、 图 像 组 合 、 算 法 绘图 等 。 通 道 操作 只 用 于 位 图 (比如 工 模 
式 和 RGB 模式 )。 大 多 数 通 道 操 作 有 一 个 或 者 两 个 图 像 参 数 ， 返 回 一 个 新 的 图 像 。 

每 张 图 片 都 是 由 一 个 或 者 多 个 数据 通道 构成 的 。 以 RGB 图 像 为 例 , 每 张 图 片 都 是 由 3 
个 数据 通道 构成 的 ， 分 别 为 R、G 和 B 通道 。 对 于 灰 度 图 像 ， 只 有 一 个 通道 。 

ImageChops 模块 的 使 用 如 下 : 

from PIL import Image 

im=Image.open('D:\\1.jJpg') 

from PIL import ImageChops 


im dup=ImageChops .duplicate (im) # 复 制图 人像， 返回 给 定 图 像 的 副本 
print (im dup.mode) # 输 出 模式 : ' RGB"' 


im diff=ImageChops .difference (im, im dup) # 返 回 两 幅 图 像 之 间 像 素 差 的 绝对 值 形成 的 图 像 
im diff.show() 


由 于 图 像 im_dup 是 由 im 复制 过 来 的 ， 所 以 它们 的 差 为 0， 图像 im_diff 在 显示 时 为 
黑 图 。 
人 ImageDravw 模块 
ImageDraw 模块 为 Inage 对 象 提供 了 基本 的 图 形 处 理 功 能 ， 例 如 它 可 以 为 图 像 添加 几 
何 图形 。 

ImageDraw 模块 的 使 用 如 下 : 


from PIL import Image, ImageDraw 
im=Image.open('D:\\1.jJpg') 

draw=ImageDraw .Draw (im) 

draw.line((0,0)+im.size, fil1l1=128) 

draw.line((0, im.size[1], im.size[0], 0), fil1l1=128) 
im.show() 


其 结果 是 在 原 有 图 像 上 男 了 两 条 对 角 线 。 

@@ ImageEnhance 模块 

ImageEnhance 模块 包括 了 一 些 用 于 图 像 增 强 的 类 ， 它 们 分 别 为 Color 类 、Brightness 
Contrast 类 和 Sharpness 类 。 

ImageEnhance 模块 的 使 用 如 下 : 


from PIL import Image, ImageEnhance 


KR 


im=Image.open('D:\\1.jJpg') 
enhancer=ImageEnhance.Brightness (im) 
m0 enhadncer enhance 9) 


im0 .Show () 


其 结果 是 图 像 im0 的 腕 度 为 图 像 im 的 一 半 。 

全 ImageFile 模块 

ImageFile 模块 为 图 像 的 打开 和 保存 提供 了 相关 文 持 功能 。 

@ ImageFilter 模块 

ImageFilter 模块 包括 各 种 滤波 器 的 预定 义 集合 ， 与 Image 类 的 filter0 方 法 一 起 使 用 。 
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该 模块 包含 一 些 图 像 增强 的 滤波 器 , 例如 BLUR、CONTOUR、DETAIL、 EDGE ENHANCE、 
EDGE ENHANCE MORE、 EMBOSS、 FIND EDGES、 SMOOTH、SMOOTH MORE 和 


SHARPEN 。 
ImageFilter 模块 的 使 用 如 下 : 


from PIL import Image 
im=Image.open('D:\\1.jJpg') 

from PIL import ImageFilter 
imout=im.filter (Imagerilter .BLUR) 


print (imout .size)# 图 像 的 尺寸 大 小 为 (300，450) ， 它 是 一 个 二 元 组 ， 即 水 平和 垂直 方 各 上 的 像素 数 


imout .Show'() 


人 @O ImageFont 模块 


ImageFont 模 块 定 义 了 一 个 同名 的 类 , 即 ImageFont 类 ,在 这 个 类 的 实例 中 存储 着 bitmap 


字体 ， 需 要 和 ImageDraw 类 的 text() 方 法 一 起 使 用 。 
在 Python 中 通过 使 用 PIL 库 中 的 这 些 模块 和 类 来 处 理 和 使 用 图 像 。 


9.3.1 生成 市 有 图 标的 二 维 码 


事先 准备 一 个 logo 图 标 髓 得 ， 使 用 下 面 的 程序 生成 带 有 logo 图 标的 二 维 码 。 


import qrcode 
from PIL import Image 
import os, sys 
def gen gqrcode(string, path, lo0ogo=""): 
生成 中 间 带 logo 的 二 维 码 
需要 安装 qrcode、PIL 库 
8 参数 string: 二 维 码 字 符 串 
6 参数 path: 生成 的 二 维 码 保存 路 径 
8 参数 1ogo: logo 文件 路 径 


Qreturn: None 


# 初 步 生成 二 维 码 图 像 
qr=qrcode .QRCode ( 
version=2, 
error correction=gqrcode.constants .ERROR CORRECT H, 
box size=8, 

border=1 


) 
qr.add data (string) 
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生成 二 维 码 和 验证 码 


qr.make (fit=True) 
# 获 得 Image 实例 并 把 颜色 模式 转换 为 RGBA 
img=qr.make image() 
img=img .convert ("RGBA") 
if logo and os.path.exists (10g0): 
ET 
icon=Image .open (10g0o) # 打 开 填 充 的 logo 文件 
img w, img h=img.size 
except Exception as e: 
print (e) 
SYS .exit (1) 
factor=4 
# 计 算 logo 的 尺寸 
size w=int (img w/factor) 
size h=int (img h/factor) 
# 比 较 并 重新 设置 1ogo 文件 的 尺寸 
icon WwW,icon h=icon.size 
1f icon w>size VW: 
licon w=size w 
1Ff COn hsize h: 
icon h=size h 
lcon=icon.resize((icon w,icon h), Image.ANTIALIAS) 
# 计 算 logo 的 位 置 ， 并 复制 到 二 维 码 图 像 中 
w=int ((img w-icon w)/2) 
h=int ((img h-icon h)/2) 
TICOm=ICOSCOTweEETRCBRA) 


img.paste(icon, (w, h),1icon) 


# 保 存 二 维 人 码 
img .save (path) # 例 如 qrcode .png 
if name ==" main ": 


info=" http://www.zut.edu.cn " 

pic path="qrcode .png" # 生 成 的 带 有 图 标的 二 维 码 图 片 ， 如 图 9-3 所 示 
logo _ path="1logo.png" # 用 于 填充 的 图 标 

gen qrcode(info, pic path,1ogo path) 


图 9-3 生成 的 市 有 图 标的 二 维 码 网 户 qrcode.png 
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9.3.2 ”Python 解析 二 维 码 图 片 


解析 二 维 码 图 片 的 信息 需要 使 用 zbarlight (二 维 码 解析 包 )，zbarlight 的 安装 如 下 : 
pip install zbarlight 
注意 ，zbarlight 二 维 码 解析 包 仅 仅 文 持 Python2.7 以 下 的 版 本 。 


import zbar 


def decode qrcode (path): 


解析 二 维 码 信息 
@ 参 数 path: 二 维 码 图 片 路 径 
@return: 二 维 码 信息 


scanner=zbar . ImageScanner () # 创 建 图 片 扫描 对 象 
scanner .parse config('enable') # 设 置 对 象 属性 
img=Image .open (path) .convert ('L')  # 打 开 含 有 二 维 码 的 图 片 
width, height=img.size # 获 取 图 片 的 尺寸 


# 建 立 zbar 图 片 对 象 并 扫描 转换 为 字 节 信息 
qrCode=zbar.Image (width, height, ‘'Y800', img.tobytes () ) 
scanner .scan (qrCode,) 
# 组 装 解码 信息 
data="" 
for s in qrCode: 
data += Ss.data 


del img # 删 除 图 片 对 象 
return data # 输 出 解码 结果 
if name ==" main ": 
Info= btpzAwww zuoteedn co " 
pic path="qrcode .png" # 生 成 的 带 有 图 标的 二 维 码 图 片 
logo path="logo.png" # 用 于 填充 的 图 标 


gen qrcode (info, pic path,1ogo patnh) 
print (decode qrcode (pic path) ) 
# 得 到 二 维 码 内 的 文本 信息 ， 即 网 址 “http://www.zut.edu.cn” 


9.4 用 Python 生成 验证 码 图 片 


基本 上 ， 大 家 使 用 每 一 种 网 络 服务 都 会 遇 到 验证 码 ， 一 般 是 网 站 为 了 
防止 恶意 注册 、 发 帖 而 设置 的 验证 手段 。 其 生成 原理 是 将 一 串 随机 产生 的 
数字 或 符号 生成 一 幅 图 片 ， 图 片 里 加 上 一 些 干扰 像素 (防止 OCR)。 下 面 
详细 讲解 如 何 生成 验证 码 。 Tp 

通常 ， 除 了 配置 好 的 Python 环境 以 外 ， 还 需要 配 有 Python 中 的 PIL 视频 讲解 
库 ， 这 是 Python 中 专门 用 来 处 理 图 片 的 库 。 
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如 果 要 生成 验证 码 图 片 ， 首 先 要 生成 一 个 随机 字符 串 ， 包 含 26 个 字母 和 10 个 数字 。 


# 用 来 随机 生成 一 个 字符 串 

def gene text (): 
#source=list (string.letters) 
二 
站 
source=list (string.ascii letters) 
for index in range(0,10): 

source.append (str (index)) 

return ''.join(random.sample (source,number)) #number 是 生成 验证 码 的 位 数 


然后 要 创建 一 个 图 片 ， 写 入 字符 串 ， 需 要 注意 这 里 面 的 字体 是 不 同系 统 而 定 的 ， 如 宁 
没有 找到 系统 字体 路 径 ， 也 可 以 不 设置 。 接 下 来 要 在 图 片上 男 几 条 干扰 线 。 
最 后 创建 扭曲 ， 加 上 小 镜 ， 用 来 增强 验证 人 码 的 效果 。 下 面 是 用 程序 生成 的 一 个 验证 人 码 。 


DRL 


完整 的 代码 如 下 : 


#coding=utf-8 

import random, string, sys, math 

from PIL import Image,ImageDraw, ImageFont, ImageFilter 
font path=' C:\Windows\Fonts\simfang.ttf '# 字 体 的 位 置 


number=4 # 生 成 几 位 数 的 验证 码 
size=(80,30) # 生 成 验证 码 图 片 的 高 度 和 宽度 
bgcolor=(255,255, 255) # 背 景 颜色 ， 默 认为 白色 
fontcolor=(0,0,255) # 字 体 颜色 ， 默 认为 蓝 色 
linecolor=(255, 0, 0) # 干 扰 线 颜色 ， 默 认为 红色 
draw line=True # 是 否 要 加 入 干扰 线 

line number= (1,5) # 加 入 干扰 线条 数 的 上 /下 限 


# 用 来 随机 生成 一 个 字符 串 

def gene text (): 
#source=list (string.letters) 
人 
SIR 
source=list (string.ascii letters) 
for index in range(0,10): 

source.append (str (index)) 

return ''.join(random.sample (source,number) )#number 是 生成 验证 码 的 位 数 

# 用 来 绘制 干扰 线 

def gene line (draw,width,height): 
begin= (random.randint (0, width), random.randint (0, height)) 
end= (random.randint (0, width), random.randint (0, height)) 
draw.line([begin, end], fill=linecolor) 

# 生 成 验证 码 


de eens CGO 人 
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width,height=size # 宽 和 高 
image=Image.new ('RGBA', (width,height),bgcolor) # 创 建 图片 
Font Tmageront Lroaeevype (tont an 23) # 验 证 码 的 字体 
draw=ImageDraw.Draw (image) # 创 建 画 笔 
text=gene text () # 生 成 字符 串 


font width, font height=font.getsize (text) 
draw.text (((width - font width) /number, (height - font height) / number) ,text, 
font=font, fil1l=fontcolor) # 填 充 字 符 串 
if draw line: 
gene line (draw,width,height) 
image=image.transform( (width+20,height+10), Image.AFFINE, 


et i ey ES ETNERREI # 创 建 扭曲 
image=image .filter (ImageFilter.EDGE ENHANCE MORE) # 滤 镜 ， 边界 加 强 
image.save('idencode.png') # 保 存 验 证 码 图 片 
if name ==" main ": 


gene °codel) 


通过 上 面 的 两 个 例子 可 见 Python 的 图 像 处 理 功能 十 分 完善 。 


| 188 


10.1 连连 看 游戏 介绍 


“连连 看 ”是 源 自 中 国 台湾 的 桌面 小 游戏 ， 自 从 流入 中 国 大 陆 以 来 风靡 视频 讲解 
一 时 ,也 吸引 了 众多 程序 员 开 发 出 多 种 版 本 的 “连连 看 ”.“ 连 连 看 ”考验 的 是 玩家 的 眼力 ， 
在 有 限 的 时 间 内 只 要 把 所 有 能 连接 的 相同 图 案 两 个 一 对 地 找 出 来 ， 每 找 出 一 对 ， 它 们 就 会 
自动 消失 ， 把 所 有 的 图 案 全 部 消 完 即 可 获得 胜利 。 所 谓 能 够 连接 ， 指 的 是 无 论 横向 或 者 纵 
向 ， 从 一 个 图 案 到 另 一 个 图 案 之 间 的 连 线 不 能 超过 两 个 弯 ， 其 中 ， 连 线 不 能 从 尚未 消去 的 
图 案 上 经 过 。 

连连 看 游戏 的 规则 如 下 : 

。 两 个 选中 的 方块 是 相同 的 。 

。 两 个 选中 的 方块 之 间 连 接线 的 折 点 不 超过 两 个 〈 连 接线 由 X 轴 和 Y 轴 的 平行 线 组 

成 )。 


图 10-1 连连 看 游戏 的 运行 界面 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


本 游戏 增加 了 智能 得 找 功能 ， 当 玩家 目 己 无 法 找到 可 以 消去 的 两 个 方块 时 右 击 男 面 ， 
系统 则 会 提示 可 以 消去 的 两 个 方块 《被 加 上 红色 的 边框 线 )。 


10.2 程序 设计 的 思路 


@ 图 标 方块 的 布局 

游戏 中 有 10 种 方块 ， 如 图 10-2 所 示 ， 而 且 每 种 方块 有 10 个 ， 可 以 先 按 顺 序 把 每 种 图 
标 方块 〈 数 字 编 号 ) 排 好 放 入 列表 tmpMap (临时 的 地 图 ) 中 ， 然 后 用 random.shuffle() 打 
乱 列 表 元 素 的 顺序 ， 依 次 从 tmnpMap (临时 的 地 图 ) 中 取 一 个 图 标 方块 放 入 地 图 map 中 。 
实际 上 ， 在 程序 内 部 是 不 需要 认识 图 标 方块 的 图 像 的 ， 只 需要 用 一 个 ID 来 表示 ， 在 运行 
界面 上 的 图 标 图 形 是 根据 地 图 中 的 ID 取 资 源 里 的 图 片 画 的 。 如 果 ID 的 值 为 空 ("” ")， 则 
说 明 此 处 已 经 被 消除 掉 了 。 


营 和 


bar 00.gf bar_01.gif bar_02.g'f bar 03.gf bar_04.gif 
已 电 


bar_05.gif bar_06.gif bar 07.glf bar 08.gif bar_09.gif 
图 10-2 图 标 方块 
imgs=[PhotoImage (file='H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 
range (0,10) ] # 所 有 图 标 图 案 


所 有 图 标 图 案 存储 在 列表 imgs 中 ， 地 图 map 中 是 图 标 图 案 存储 在 列表 imgs 中 的 索引 
号 。 如 果 是 bar 02.gf 图 标 ， 在 地 图 map 中 实际 存储 的 是 2; 如 果 是 bar 08.gf 图 标 ， 在 地 
图 map 中 实际 存储 的 是 8。 

# 初 始 化 地 图 ， 将 地 图 中 的 所 有 方块 区 域 位 置 置 为 空 方块 状态 


map=[[" " for y in range (Height)]for x In range(Width) ] 
# 存 储 图 像 对 象 
image map=[[" " for y in range (Height)]for x In range (Width)] 


cv=Canvas (root, bg="'green', width=610, height=610) 
def create map () :# 产 生 map 地 图 


global map 

# 生 成 随机 地 图 

# 将 所 有 匹配 成 对 的 图 标 索 引号 放 进 一 个 临时 的 地 图 中 
tmpMap=[] 


m= (Width)* (Height)//10 
print ('m=",m) 


for x in range (0,m): 
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For TY rangqetQ 10) # 每 种 方块 有 10 个 
tmpMap .append (x) 
random. shuffle (tmpMap) # 生 成 随机 地 图 


for x in range(0,Width): 
for y in range(0,Height): 
map [X] [y]=tmpMap [x*Height+y] # 从 上 面 的 临时 地 图 中 获取 
@ 连通 算法 
那么 分 析 一 下 ， 可 以 看 到 连接 一 般 有 3 种 情况 ， 如 图 10-3 所 示 。 


[= 国 口 
SS 和 
号 … 本 
直 连 一 个 折 点 两 个 折 点 


图 10-3 ”两 个 选中 方块 之 间 连 接线 的 示意 图 


1) 直 连 方式 

在 直 连 方式 中 ， 要 求 两 个 选中 的 方块 x 和 y 相同 ， 即 在 一 条 直线 上 ， 并 且 之 间 没 有 其 
他 任何 图 案 的 方块 。 直 连 方式 在 3 种 连接 方式 中 最 简单 。 

2) 一 个 折扣 

其 实 ， 访 情况 相当 于 两 个 方块 画 出 一 个 矩形 ， 这 两 个 方块 是 一 对 对 角 顶 点 ， 男 外 两 个 
顶点 中 的 某 个 顶点 ( 即 折 点 如 果 可 以 同时 和 这 两 个 方块 直 连 ， 就 说 明 可 以 “一 折 连 通 ”。 

3) 两 个 折 点 

这 种 方式 的 两 个 折 点 (zl1、z2)〉 必定 在 两 个 目标 点 (两 个 选中 的 方块 )pl1、p2 所 在 的 
X 方 回 或 y 方 回 的 直线 上 。 

按 pl(x1,y1) 点 回 4 个 方 回 探测 ,例如 同 右 探测 ,每 次 x1+1, 判 断 z1(x1+1,y1) 和 p2(x2,y2) 
点 可 个 形成 一 个 折 上 点 连通 性 ， 如 有 果 可 以 形成 连通 ， 则 两 个 折 点 连通 ， 人 否则 直到 超过 图 形 右 
边界 区 域 。 假 如 超过 图 形 右 边界 区 域 ， 则 还 需要 判断 两 个 折 点 在 选中 方块 的 右 侧 ， 且 两 个 
折 点 在 图 案 区 域 之 外 连通 情况 是 否 存 在 。 此 时 判断 可 以 简化 为 判断 p2(x2.y2) 是 否 可 以 水 平 
直通 到 边界 。 

经 过 上 面 的 分 析 ， 两 个 方块 是 否 可 以 抵消 的 流程 图 如 图 10-4 所 示 。 
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直 连 方式 判断 


并 


图 10-4 流程 图 


根据 图 10-4 所 示 的 流程 图 ， 对 选中 的 两 个 方块 (分 别 在 (x1,y1)、(x2,y2) 位 置 ) 是 人 否 可 
以 抵消 的 判断 如 下 实现 。 把 该 功能 封装 在 IsSLink( 方 法 里 面 ， 其 代码 如 下 : 
判断 选中 的 两 个 方块 是 否 可 以 消除 
def IsLInK(P1,P2) : 
if lineCheck (pl, p2): 


return True 


EF secondbinelpL pp2): # 一 个 转弯 ( 折 点 ) 的 连通 方式 
return True 
Tn # 两 个 转弯 〈 折 点 ) 的 连通 方式 


return True 
return False 


直 连 方式 分 为 x 或 y 相同 的 情况 ， 同 行 同 列 情况 消除 的 原理 是 如 果 两 个 相同 的 被 消除 
方块 之 间 的 空格 数 spaceCount 等 于 它们 的 ( 行 / 列 差 -1)， 则 两 者 可 以 连通 。 
class Point: 
# 点 类 
def init (self,x,y): 
Self .x=x 
self .y=y 
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* X 代表 列 ，y 代表 行 
* param pl 第 1 个 保存 上 次 选中 点 坐标 的 点 对 象 
* param p2 第 2 个 保存 上 次 选中 点 坐标 的 点 对 象 
# 直 接连 通 
def lineCheck (pl, p2): 
absDistance=0 
spaceCount=0 
if (pli.x==p2.x or pl.y==p2-y) > 手 同 行 同 列 吗 
print (" 同 行 同 列 的 情况 ----=-- 
# 同 列 的 情况 
if (pl.x==p2.x and pl.y != p2.y) 
print (" 同 列 的 情况 ") 
# 绝 对 距离 (中 间隔 着 的 空格 数 ) 
absDistance=abs (pl .y-p2.y)-1 


# 正 / 负 值 
1 pl yp22Yy > 0 
zf=—1 
else: 
zf=1 
for 1 in range(l,absDistance+l1): 
if (map[Ilplszx]IplsYy + 1* zf]==" ™): 
# 空 格 数 加 1 
spaceCount+=] 
else: 
break;# 过 到 阻碍 就 不 用 再 探测 了 
elrft i (pl. yp2:Y and pl.x!=p2.x)-: # 同 行 的 情况 


print ("同行 的 情况 ") 
absDistance=abs (pl .x-p2.x)—1 


# 正 / 负 值 
ETDpl 2 D2 x 


for 1 in range(l,absDistance+l): 
if (mapIlpl.xz tr 1 * Zzf]Iplsv|=—"™ ™): 
# 空 格 数 加 1 
spaceCount+=] 
else: 
break; # 壳 到 阻碍 就 不 用 再 探测 了 
if (spaceCount==absDistance) 
# 可 连通 


print (absDistance, spaceCount) 
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print (" 行 / 列 可 直接 连通 ") 
return True 

else: 
print (" 行 / 列 不 能 消除 ! ") 
return False 


else: 
# 不 是 同行 同 列 的 情况 ， 所 以 直接 返回 False 
return False; 
一 个 折 点 连通 使 用 OneCorerLinkO 实 现 判断 。 其 实 相当 于 两 个 方块 国 出 一 个 和 矩形， 这 
两 个 方块 是 一 对 对 角 顶 点 ， 见 图 10-5 中 两 个 黑色 目标 方块 的 连通 情况 , 右上 角 打 叉 的 位 置 
就 是 折 点 ， 左 下 和 角 打 叉 的 位 置 不 能 与 左上 角 的 黑色 目标 方块 连通 ， 所 以 不 能 作为 折 点 。 


图 10-5 一 个 折 点 连通 示意 图 


如 果 找 到 ， 则 把 折 点 放 入 linePointStack 列表 中 。 
# 第 2 种 ， 一 个 折 点 连通 (直角 连通 ) 


一 个 打点 连通 
@param first: 选 中 的 第 1 个 点 
Q@param second: 选 中 的 第 2 个 点 


def secondLine (pl, p2): 


# 第 1 个 直角 检查 点 

checkP=Point (pl .x, p2.y) 

# 第 2 个 直角 检查 点 
checkP2=Point (p2 .x, pl.y); 

# 第 1 个 直角 点 检测 

if (map [checkP.X] [checkP.y]==" "): 


if (lineCheck (pl, checkP) and lineCheck (checkP, p2)): 
linePointstack.append (checkP) 
print ("直角 消除 OK", checkP.x,checkP.y) 
return True 
# 第 2 个 直角 点 检测 
if (map [checkP2.X] [checkP2.y]==" "): 
if (lineCheck (pl, checkP2) and lineCheck (checkP2, p2)): 
linePointstack.append (checkP2) 
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print ("直角 消除 OK" ,checkP2 .x, checkP2.y) 
return True 
print ("不 能 直角 消除 "”) 


return False 


两 个 打点 连通 〈 双 直角 连通 ) 使 用 TwoComerLinkO 实 现 判断 。 双 直角 连通 的 判定 可 以 
分 两 步 进行 : 

(1) 在 pl 点 周围 的 4 个 方 癌 寻找 空 块 checkP 点 。 

(2) 调用 OneCornerLink(checkP p2) 检测 checkpP 与 p2 点 可 人 否 形成 一 个 折 点 连通 性 。 

两 个 折 点 连通 即 壳 历 pl 点 周围 4 个 方 回 的 空格 ， 使 之 成 为 checkP 点 ， 然 后 调用 
OneComerLink(checkP, p2) 判 定 是 否 为 真 ， 如 果 为 真 ， 可 以 双 直 角 连 通 ， 夺 所 有 的 空格 都 遍 
历 完 还 没有 找到 ， 则 失败 。 

如 果 找 到 ， 则 把 两 个 折 点 放 入 linePointStack 列表 中 。 


# 第 3 种 ， 两 个 折 点 连通 〈 双 直角 连通 ) 
@param pl 第 1 个 点 
@param p2 第 2 个 点 
def TwoCornerLink (pl, p2): 
checkP=Point (pl .x, pl.y) 
#4 个 方向 的 探测 开始 
for 1 in range(0,4): 
CcheckP .x=pl .x 
checkP .y=pl.y 
# 问 下 
1f (i1==3): 
checkP .y+=1 
while( (checkP.y<Height) and map [checkP.Xx] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
else: 
linePointstack .pop() 
CcheckP .y+=1 
# 回 右 
芷 证 了 二 一 汉 和 
checkP .x+=1 
whilel( (checkP.x<Width) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checKkP) 
if (OneCornerLink (checkP, p2)): 
print (" 右 探测 OK") 
return True 


else: 
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linePointstack .pop'() 
CheckP .x+=1 


# 问 左 
elif (1==1): 
checkP .x—=1 
whilel( (checkP.x>=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checKkP) 
if (OneCornerLink (checkP, p2)): 
print (" 左 探测 OK") 
return True 
else: 
linePointstack .pop() 
checkP .x—=1 
# 回 上 
eliEl 0 


checkP .y-=1 
while( (checkP.y >=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("上 探测 OK") 
return True 
else: 
linePointstack .pop'() 
CcheckP .y-—=1 
#4 个 方 同 寻 完 也 没 找到 适合 的 checkP 点 
print ("两 直角 连接 没 找到 适合 的 checkP 点 ") 


return False; 
注意 : 上 面 的 代码 在 测试 两 个 折 点 连通 时 并 没有 考虑 两 个 折 点 都 在 游戏 区 域外 部 的 情 
况 ， 有 些 连连 看 游戏 不 允许 折 点 在 游戏 区 域外 侧 ( 即 边界 外 )。 如 果 允 许 这 种 情况 ,对 上 面 
的 代码 做 如 下 修改 。 


# 同 下 
if (1==3) 
checkP .y+=1 
while( (checkP.y<Height) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
1If (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
else: 
linePointstack .pop'() 
checkP .y+=1 
# 补 充 两 个 折 点 都 在 游戏 区 域 底 侧 外 部 
if checkP .y=——Height: # 出 了 底部 ， 仅 需 判 断 p2 能 否 达到 底部 边界 


Zz=Point (p2.x,Height-—1) # 底 部 边界 点 
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if lineCheck(z,p2) : # 两 个 折 点 在 区 域外 部 的 底 侧 
linePointstack.append (Point (pl .x, Height)) 
linePointstack.append (Point (p2.x, Height)) 


print ("下 探测 到 游戏 区 域外 部 OK") 


return True 
对 于 其 余 3 个 方 回 的 边界 外 部 两 个 打点 的 连通 情况 判断 ， 请 读者 上 自己 思考 添加 。 


全 智能 查找 功能 的 实现 
藻 要 在 地 图 上 上 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 ， 通 背 采 用 电 历 算法 。 下 面 借助 
图 10-6 分 析 此 算法 。 


图 10-6 [匹配 示意 图 1 


在 图 中 找 相 同 的 方块 时 ， 将 按 方块 地 图 map 的 下 标 位 置 对 每 个 方块 进行 查找 ,一旦 找 
到 一 组 相同 、 可 以 抵消 的 方块 则 马上 返回 。 在 查找 相同 方块 组 的 时 候 ， 必 须 先 确定 第 1 个 
选 定 方块 (例如 0 号 方块 )， 然 后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 ， 即 从 1 开始 按 
照 ]、2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 ， 并 判断 选 定 的 两 个 方块 是 否 连通 
抵消 ， 假 如 0 号 方块 与 5 号 方块 连通 ， 则 经 过 (0,1)、(0,2)、(0,3)、(0,4)、(0,5) 共 5 组 数据 
的 判断 对 比 ， 若 成 功 立 即 返 回 。 

如 果 找 不 到 匹配 的 第 2 个 选 定 方块 ， 则 如 图 10-7 (a) 所 示 编 号 加 1 重新 选 定 第 1 个 
方块 〈 即 1 号 方块 ) 进入 下 一 轮 ， 然 后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 ， 即 如 图 
10-7 (b) 所 示 从 2 号 开始 按照 2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方 块 ， 直 到 搜 
索 到 最 后 一 块 ( 即 15 号 方块 )。 那 么 为 什么 从 2 开始 查找 第 2 个 选 定 方块 ， 而 不 是 从 0 号 
开始 呢 ?” 因 为 在 将 1 号 方块 选 定 为 第 1 个 选 定 方块 前 ，0 号 已 经 作为 第 1 个 选 定 方块 对 后 
面 的 方块 进行 可 连通 的 判断 了 ， 它 必然 不 会 与 后 面 的 方块 连通 。 


(a) 0 号 方块 找 不 到 匹配 方块 ， 选 定 1 号 (b) 从 2 号 方块 开始 找 匹 配 
图 10-7 ”匹配 示意 图 2 


如 果 找 不 到 与 1 号 方块 连通 且 相 同 的 方块 ， 则 编号 加 1 重新 选 定 第 1 个 方块 〈 即 2 号 
方块 ) 进入 下 一 轮 ， 从 3 号 开始 按照 3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 。 
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按照 上 面 设计 的 算法 ， 整 个 流程 图 如 图 10-8 所 示 。 
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第 一 个 方块 的 编号 
i 初始 化 为 0 


第 2 个 方块 的 编号 
j 初 始 化 为 这] 


判断 两 个 方块 是 否 
相通 且 连 通 


否 
第 2 个 方块 编号 加 ] 


I 断 是 否 最 后 一 个 


j=m_nRow *Im_nCol 


是 
第 1 个 方块 编号 加 1 


bFound = Irue 


| 断 是 否 最 后 一 个 


i=m_nRow*m_nCol 


判断 bFound=True 


找到 后 用 画笔 画 
出 选中 框 线 


返回 bFound 


图 10-8 ”智能 查找 匹配 方块 的 流程 图 
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根据 流程 图 ， 把 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 的 功能 封装 在 Find2Block0 方 
法 里 面 ， 其 代码 如 下 : 


def find2Block (event): # 上 自动 查找 
global firstSelectRectId,SecondSelectRectId 
m nRoW=Height 
m nCol=Width 
bFound=False; 
# 第 1 个 方块 从 地 图 的 0 位 置 开始 
for 1 in range(0, m nRoW* m nCol): 
# 找 到 则 跳出 循环 
if (brFound}y: 
break 
# 算 出 对 应 的 虚拟 行 / 列 位 置 
XxXl1=1%m nCol 
yl=i//m nCol 
pl=Point (xl1, y1) 
# 无 图 案 的 方块 跳 过 
if (map[xl1] [yl1]==" '): 
continue 
# 第 2 个 方块 从 前 一 个 方块 的 后 面 开始 
for ] in range(i+l, m nNnRoW* m nCol): 
# 算 出 对 应 的 虚拟 行 / 列 位 置 
X2=]g%gm nCol 
yY2=]//m nCol 
p2=Point (x2, y2) 
# 第 2 个 方块 不 为 空 ， 且 与 第 1 个 方块 的 图 标 相同 
1If (map[x2] [y2]!=' ' and IsSame (pl,p2)): 
# 判 断 是 否 可 以 连通 
TE ESL D2: 


bFound=True; 


break 
# 找 到 后 
if (bFound): #1 (XL ey1] 与 DP2(z22Y2% 过 通 
print{" 找 到 后 ",pl.xX,pl.y,p2.xX,p2.Y) 
# 画 选 定 (x1, y1) 处 的 框 线 


firstSelectRectId=cv.create rectangle (x1*40,yl1*40,x1*40+40, 
yl*40+40, width=2, outline="red") 
# 男 选 定 (x2, y2) 处 的 框 线 
secondSselectRectld=cv:Ccreate rectangle (x2*40, YZ2*40, x2*401+40, 
y2*40+40, outline="red") 
#t=Timer (timer interval,delayrun) # 定 时 函数 自动 消除 
二 ET 

return brFound 
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10.3 关键 技 巍 郝 
10.3.1 ”图形 绘制 一 一 Tinker 的 Canvas 组 件 党 2 


视频 讲解 
Tinker 的 Canvas( 男 布 ) 是 一 个 长 方形 区 域 ， 用 于 图 形 绘 制 或 复杂 的 图 
形 界面 布局 。 用 户 可 以 在 画布 上 绘制 图 形 、 创 建文 字 、 放 置 各 种 组 件 和 框架 。 


@@ 创建 Canvas 对 象 
用 户 可 以 使 用 下 面 的 方法 创建 一 个 Canvas 对 象 。 
Canvas 对 和 三 Canvas( 汪 日 对 稍 二 选项 


其 常用 选项 如 表 10-1 所 示 。 


表 10-1 Canvas 的 常用 选项 


属 性 说 明 
bd 指定 画布 的 边框 宽度 ， 单 位 是 像素 
bg 指定 画布 的 背景 颜色 
confine 指定 画布 在 滚动 区 域外 是 否 可 以 滚动 ， 默 认为 True， 表 示 不 能 滚动 
cUISOT 指定 画布 中 的 鼠标 指针 ， 例 如 arrow、circle、dot 
height 指定 画布 的 高 度 
highlightcolor 选中 画布 时 的 背景 色 
relief 指定 画布 的 边框 样式 ， 可 选 值 有 SUNKEN、RAISED、GROOVE、RIDGE 
scrollregion 指定 画布 的 滚动 区 域 的 元 组 (wn,e,s) 


@ 显示 Canvas 对 象 

显示 Canvas 对 象 的 方法 如 下 : 

Canvas 对 象 .pack () 

例如 创建 一 个 白色 背景 、 宽 300、 高 120 的 画布 。 


from tkinter import * 

root=Tk () 

cv=Canvas (root, bg="'white', width=300, height=120) 
cv.create line(10,10,100,80,width=2，dash=7)  # 绊 制 直线 
Cup # 显 示 男 布 
root .malnloop () 


10.3.2 ”Canvas 上 的 图 形 对 象 


在 Canvas 上 可 以 绘制 各 种 图 形 对 象 ， 通 过 调用 以 下 绘制 函数 实现 。 
e。 create arc(): 绘制 圆 距 。 

e。 create line(): 绘制 直线 。 

。 create bitmap(): 绘制 位 图 。 
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。 create image(): 绘制 位 图 图 像 。 

。 create oval(): 绘制 覃 圆 。 

e。 create rectangle(): 绘制 矩形 。 

e create polygon(): 绘制 多 边 形 。 

e。 create window(): 绘制 子 窗口 。 

e create text(): 创建 一 个 文字 对 象 。 

Canvas 上 的 每 个 绘制 对 象 都 有 一 个 标识 ID (整数 )， 在 使 用 绘制 函数 创建 绘制 对 象 时 


返回 绘制 对 象 ID 。 例 如 : 


idl=cv.create line(10,10,100,80,width=2，dash=7) <# 绘 制 直线 
通过 ID1 可 以 得 到 绘制 对 象 直线 ID。 

在 创建 图 形 对 象 时 可 以 使 用 tags 属性 设置 图 形 对 象 的 标记 (tag)， 例 如 : 
Ee rodte EOREon Ee LL LO LO LO Ag 

上 面 的 语句 指定 矩形 对 象 rt 具有 一 个 标记 Tl。 

用 户 也 可 以 同时 设置 多 个 标记 ， 例 如 : 

TE EV rd eGoamLeL I 省 让 


上 面 的 语句 指定 矩形 对 象 rt 具有 3 个 标记 rl1、r2、r3。 
在 指定 标记 后 ， 使 用 find withtag() 方 法 可 以 获取 到 指定 tag 的 图 形 对 象 ， 然 后 设置 图 


形 对 象 的 属性 。find withtag0 方 法 的 语法 如 下 : 


Canvas 对 象 .find withtag (tag 名 ) 


find_withtag() 方 法 返回 一 个 图 形 对 象 数组 ， 其 中 包含 所 有 具有 tag 名 的 图 形 对 象 。 
使 用 itemconfig0 方 法 可 以 设置 图 形 对 象 的 属性 ， 语 法 如 下 : 


Canvas 对 象 .itemconfig (图 形 对 象 ， 属 性 1= 值 1， 属 性 2= 值 2…) 
[ 例 ]10-1 使 用 tags 属性 设置 图 形 对 象 标记 。 


from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg="'white', width=200, height=200) 

# 使 用 tags 给 第 1 个 矩形 指定 3 个 tag 

rt=cv.create rectangle(10,10,110,110, tags=("rl1l"','r2","r3")) 

CV .pack () 

cv.create rectangle (20,20,80,80, tags ="'r3')# 使 用 tags 给 第 2 个 矩形 指定 一 个 tag 

# 将 所 有 与 tag ('r31') 绑 定 的 item 边框 的 颜色 设置 为 蓝 色 

for ltem In cv.find withtag(r3"]: 
cv.itemconfig(item,outline='blue') 


root .mainloop () 


下 面 学 习 使 用 绘制 函数 绘制 各 种 图 形 对 象 及 对 图 形 对 象 进行 修改 等 操作 。 
@ 绘制 加 着 
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使 用 create arc(0) 方 法 可 以 创建 一 个 圆 踊 对 象 ， 可 以 是 一 个 嘴 、 饼 图 面 区 或 者 是 一 个 简 
单 的 弧 ， 具 体 语 法 如 下 : 


Canvas 对 象 .create arc ( 弧 外 框 矩 形 左上 角 的 x 坐标 ， 弧 外 框 逢 形 左 上 角 的 y 坐标 ， 弧 外 框 
矩形 右 下 角 的 x 坐标 ， 弧 外 框 算 形 右 下 角 的 y 坐标 ， 选 项 ，...) 


创建 圆 弧 时 的 常用 选项 ，outline 指定 圆 弧 边框 的 颜色 ，fill 指定 填充 颜色 ，width 指定 
圆 弧 边框 的 宽度 ，start 代表 起 始 角度 ，extent 代表 指定 角度 偏 移 量 而 不 是 终止 角度 。 
[ 贺 10-2 使 用 create_arc0 方 法 创建 圆 弧 ， 运 行 效果 如 图 10-9 所 示 。 


from tkinter import * 
root=Tk () 
# 创 建 一 个 Canvas， 设 置 其 背景 色 为 白色 
cCV=CanVas (root, bg="'white') 
cv.create arc((10,10,110,110),) # 使 用 默认 参数 创建 一 个 圆 弧 ， 结 果 为 90” 的 局 形 
d={1:PIESLICE, 2:CHORD, 3:ARC] 
FOF Ln 
# 使 用 3 种 样式 ， 分 别 创建 了 扇形 、 号 形 和 弧 形 
cv.create arc((10,10+60*1,110,110+60*1),style=d[1]) 
prinelre drii) 
# 使 用 start/extent 指定 圆 弧 起 始 角 度 与 偏 移 角 度 
Cv.create arcl( 
(150,150,250,250), 


start=10, # 指 定 起 始 角 度 
extent=120 # 指 定 角 度 偏 移 量 ( 逆 时 针 ) 
) 

cv .pack() 


root .mainloop() 


图 10-9 ”创建 圆 弧 


人 @ 绘制 线条 
使 用 create line(0 方 法 可 以 他 | 建 一 个 线 条 对 象 具体 语法 如 下 . 


line=canvas.create line(x0, y0, xl, yl, **, xn, yn, 选项 ) 


参数 (x0, y0)，(x1, yl1 )，…*，(xn, yn) 是 线段 的 新 点 。 
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创建 线段 时 的 利用 选项 : width 指定 线段 宽度 ，arrow 指定 是 否 使 用 盘 头 《没有 篆 头 为 


none, 起 点 有 箭头 为 first, 终点 有 箭头 为 last, 两 端 有 箭头 为 both)，fill 指定 线段 颜色 , dash 
指定 线段 为 虚线 (其 整数 值 决 定 虚线 的 样式 )。 


[ 例 ]10-3 使 用 create_line0 方 法 创建 线条 ， 运 行 效果 如 图 10-10 所 示 。 


from tkinter import * 


root=Tk () 

cv=Canvas (root, bg="'white', width=200, height=100) 

cv.create line(10, 10, 100, 10, arrow='none') # 绘 制 没 有 第 头 的 线段 
CT Create Tinell0 rr 20 7100 0 20 a7TON="first") # 绘 制 起 点 有 第 头 的 线段 
CV-Create line(10, 30, 100, 30, arrow="last") # 绘 制 终 点 有 第 头 的 线段 
Cv.create line(10, 40, 100, 40, arrow="'both") # 绘 制 两 端 有 箭头 的 线段 
Cry.create line(10,50,100, 100.width=3, aash=7) # 绘 制 虚线 

cv .pack () 


root .mainloop() 


图 10-10 创建 线条 


全 绘制 算 形 
使 用 create_rectangle( 方 法 可 以 创建 矩形 对 象 ， 具 体 语 法 如 下 : 


Canvas 对 象 .create rectangle ( 甜 形 左上 角 的 x 坐标 ， 甜 形 左 上 角 的 y 坐标 ， 甜 形 右 下 角 
的 x 坐标， 和 矩形 右 下 角 的 y 坐标 ， 选 项 ，...) 


创建 矩形 对 象 时 的 常用 选项 : outline 指定 边框 闫 色 ，fil 指定 填充 颜色 ，width 指定 边 


框 的 宽度 ，dash 指定 边框 为 虚线 ，stipple 使 用 指定 自 定义 画 刷 填充 矩形 。 


[ 例 ]10-4 使 用 create_rectangle0) 方 法 创建 和 矩形， 运行 效果 如 图 10-11 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=200, height=100) 
cv.create rectangle(10,10,110,110, width =2,fil1l="'red') 

# 指 定 和 矩形 的 填充 色 为 红色 、 宽 度 为 2 
cv.create rectangle(120，20，180，80，outline='green')# 指 定 逢 形 的 边框 颜色 为 绿色 
di 
root .mainloop() 
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图 10-11 创建 窍 形 对 象 


@@ 绘制 多 边 形 

使 用 create polygon0) 方 法 创建 一 个 多 边 形 对 象 ， 可 以 是 一 个 三 角形 、 和 矩形 或 者 任意 一 
个 多 边 形 ， 具 体 语 法 如 下 : 

Canvas 对 象 . create polygon (顶点 1 的 x 坐标， 顶点 1 的 y 坐标 ， 顶 点 2 的 x 坐标， 顶点 

2 的 y 坐标 ，…*， 顶 点 nn 的 x 坐标， 顶点 nn 的 y 坐标 ， 选 项 ，…) 


创建 多 边 形 对 象 时 的 常用 选项 : outline 指定 边框 颜色 ，fill 指定 填充 颜色 ，width 指定 
边框 的 宽度 ，smooth 指定 多 边 形 的 平滑 程度 〈 等 于 0 表示 多 边 形 的 边 是 折线 ， 等 于 1 表示 
多 边 形 的 边 是 平滑 曲线 )。 

[ 例 ]10-5 创建 三 角形 、 正 方形 、 对 顶 三 角形 ， 运 行 效果 如 图 10-12 所 示 。 


from tkinter import * 

root=Tk () 

cv=Canvas (root, bg="'white', width=300, height=100) 

cv.create polygon (35,10,10,60,60,60, outline="'blue',fill='red', width=2) 
# 等 腰 三 角形 

cv.create polygon(70,10,120,10,120,60,out1llIne='blue' ,fl11="whlite',wlIdth=2) 
# 直 角 三 角形 

cv.create polygon (130,10,180,10,180,60,130,60，width=4)  # 黑 色 填 充 正 方形 

cv.create polygon (190,10,240,10,190,60,240,60，width=1)  # 对 顶 三 角形 

Cv-DacE(} 


root .mainloop() 


图 10-12 创建 三 角形 、 正 方形 、 对 顶 三 角形 


绘制 椭圆 
使 用 create_oval(0) 方 法 可 以 创建 一 个 李 圆 对 象 ， 有 具体 语法 如 下 : 


Canvas 对 象 . create_oval ( 包 库 椭圆 的 矩形 左上 角 x 坐标 ， 包 庄 李 圆 的 算 形 左上 角 y 坐标 ， 包 
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里 椭圆 的 矩形 右 下 角 x 坐标 ， 包 暑 椭 圆 的 窍 形 右 下 角 y 坐标 ， 选 项 ， .. .) 


创建 椭圆 对 象 时 的 常用 选项 : outline 指定 边框 颜色 ，fill 指定 填充 颜色 ，width 指定 边 
框 的 宽度 。 如 果 包 里 椭圆 的 矩形 是 正方 形 ， 则 绘制 的 是 一 个 圆 形 。 
[ 例 ]10-6 创建 椭圆 和 圆 形 ， 运 行 效果 如 图 10-13 所 示 。 


from tkinter import * 

root=Tk () 

cv=Canvas (root, bg='white', width=200, height=100) 

cv.create oval (10,10,100,50, outline='blue', fill='red', width=2)# 彬 圆 
cv ereate OvalliD0o 0 T1900 100 ot line De Fil "red width=214 国 形 
cv .pack () 


root .mainloop() 


图 10-13 创建 椭圆 和 辆 形 


@ 创建 文字 
使 用 create_text0 方 法 可 以 创建 一 个 文字 对 象 ， 具 体 语法 如 下 : 


文字 对 象 =canvas 对 象 .create text ( (文本 左上 角 的 x 坐标 , 文本 左上 角 的 y 坐标 ) ， 选 
项 ， …) 


创建 文字 对 象 时 的 常用 选项 : text 是 文字 对 象 的 文本 内 容 ，fill 指定 文字 闫 色 ，anchor 
控制 文字 对 象 的 位 置 (其 取 值 'w' 表 示 左 对 齐 ，'e' 表 示 右 对 齐 ，n' 表 示 顶 对 齐 ，'s' 表 示 确 对 
齐 ，'nw' 表 示 左 上 对 齐 ，'sw' 表 示 左 下 对 齐 ，'se' 表 示 右 下 对 齐 ，'ne' 表 示 右 上 对 齐 ，'center 
表示 居中 对 齐 ，anchor 的 默认 值 为 'center')，justify 设置 文字 对 象 中 文本 的 对 齐 方式 (其 取 
值 left 表 示 左 对 齐 ，Tight' 表 示 右 对 齐 ，'center' 表 示 拓 中 对 齐 ，justify 的 默认 值 为 'center')。 
[ 例 ]10-7 创建 文本 ， 运 行 效果 如 图 10-14 所 示 。 


from tkinter import * 

root=Tk () 

cv=Canvas (root, bg='white', width=200, height=100) 

cv.create text((10,10), text='Hello Python', fill='red', anchor="'nw') 
EV EFCILeN ERE TU EE 你 好 ， Python', fill='blue', anchor="'se') 
cv .pack () 


root .mainloop() 
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select from() 方 法 用 于 指定 选中 文本 的 起 始 位 置 ， 有 具体 语法 如 下 : 
Canvas 对 象 .select from (文字 对 象 ， 选 中 文本 的 起 始 位 置 ) 

select to() 方 法 用 于 指定 选中 文本 的 结束 位 置 ， 具 体 语法 如 下 : 
Canvas 对 象 .select to (文字 对 象 ， 选 中 文本 的 结束 位 置 ) 

[ 例 ]10-8 ”选中 文本 的 例子 ， 运 行 效果 如 图 10-15 所 示 。 


from tkinter import * 

root=Tk () 

CVv=Canvas (root, bg="'white', width=200, height=100) 

txt=cv.create text ( (10,10), text=' 中 原 工学 院 计算 机 学 院 '，fill='red',，, anchor="'nw') 
# 设 置 选 中 文本 的 起 始 位 置 

cv.select froml(txt,o5) 

# 设 置 选 中 文本 的 结束 位 置 

cv.select to (txt, 9) # 选 中 “计算 机 学 院 ” 

Cv-Dack(} 


root .malnloop () 


图 10-14 创建 文本 图 10-15 ”选中 文本 
@ 绘制 位 图 和 图 像 


1) 绘制 位 图 

使 用 create bitmap(0) 方 法 可 以 绘制 Python 内 置 的 位 图 ， 有 具体 语法 如 下 : 

Canvas 对 象 .create bitmap( (x 坐标 ,y 坐标 ) ,bitmap= 位 图 字符 串 ， 选 项 ，…) 

(x 坐标 ,y 坐标 ) 是 位 图 放置 的 中 心 坐 标 , 常 用 选项 :bitmap、activebitmap 和 disabledbitmap 
分 别 用 于 指定 正常 、 活 动 、 禁 用 状态 显示 的 位 图 。 

2) 绘制 图 像 

在 游戏 开 及 中 需要 使 用 大 量 图 像 ， 采 用 create_bitmap( 方 法 可 以 绘制 图 形 图 像 ， 具 体 
语法 如 下 : 

Canvas 对 象 .create image ((X 坐 标 ,y 坐标 )，image= 图 像 文 件 对 象 ， 选 项 ，…) 

(x 坐标 ,y 坐标 ) 是 图 像 放 置 的 中 心 坐标 ,常用 选项 : Image、activeimage 和 disabled image 
用 于 指定 正常 、 活 动 、 禁 用 状态 显示 的 图 像 。 
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注意 : 使 用 PhotoImageO 函 数 来 获取 图 像 文件 对 象 。 
ijmgl=PhotoImage (file= 图 像 文 件 ) 


例如 ，img1=PhotoImage(file='C:\\aa.png') 获取 笑脸 图 形 。Python 文 持 的 图 像 文 件 格式 
一 般 为 .png 和 .gif。 
[ 例 ]10-9 绘制 图 像 示例 ， 运 行 效果 如 图 10-16 所 示 。 


from tkinter import * 


root=Tk () 

CV=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') # 笑 脸 
m2=Phiotoimagelfile eV 2 iF") # 方 块 入 
img3=PhotoImage (file="'C:\\3.gif'") # 梅 花 A 
cv.create image((100,100),image=imgl1) # 绘 制 笑 脸 
cv.create image((200,100),image=img2) # 绘 制 方块 A 
cv.create image((300,100),image=img3) # 绘 制 梅 花 A 


d={1:"'error',2:'info',3:'question',4:'hourglass',5:'questhead', 
Te 
#cv.create bitmap((10,220),bitmap=d[1]) 
# 以 下 遍历 字典 绘制 Python 内 置 的 位 图 
ED i ne 
Cv.create bitmap((20*1,20),bitmap=d[1]) 
cv .pack () 


root .mainloop () 


图 10-16 绘制 图 像 示 例 


在 学 会 绘制 图 像 之 后 ， 就 可 以 开发 图 形 版 的 扑克 和 脾 、 连 连 看 、 推 箱子 等 游戏 了 。 

和 @ 修改 图 形 对 象 的 坐标 

使 用 coords(0) 方 法 可 以 修改 图 形 对 象 的 坐标 ， 有 具体 语法 如 下 : 

Canvas 对 象 .coords (图 形 对 象 ，( 图 形 左 上 角 的 x 坐标， 图 形 左 上 角 的 y 坐标 ， 图 形 右 下 角 的 x 

坐标 ， 图 形 右 下 角 的 y 坐标 ) ) 

因为 可 以 同时 修改 图 形 对 象 的 左上 和 角 的 坐标 和 右 下 角 的 坐标 ， 所 以 可 以 缩放 图 形 
对 象 。 
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注意 : 如 果 图 形 对 象 是 图 像 文 件 ， 则 只 能 指定 图 像 的 中 心 点 坐标 ， 而 不 能 指定 图 像 对 
象 左上 角 的 坐标 和 右 下 角 的 坐标 ， 故 不 能 缩放 图 像 。 


[ 例 ]10-10 修改 图 形 对 象 的 坐标 示例 ， 运 行 效果 如 图 10-17 所 示 。 


from tkinter import * 


root=TKk () 

CV=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') # 笑 脸 
img2=PhotoImage (file="'C:\\2.gif"') # 方 块 A 

im Piotormge(trile "eC VI girt"y # 梅 花 A 
rtl=cv.create image((100,100),image=img1) # 绘 制 笑 脸 
rt2=cv.create image((200,100),1image=img2) # 绘 制 方块 A 

下 3 三 CT-: Create image ( (300,100),image=img3) # 绘 制 梅花 A 

# 重 新 设置 方块 A (rt2 对 象 ) 的 坐标 

cv.coords (rt2, (200, 50)) # 调 整 rt2 对 象 的 位 置 
rt4=cv.create rectangle (20,140,110,220,outline='red',fil1='green') 间 正方 形 对 象 
cv.coords (rt4, (100,150,300,200) ) # 调 整 rt4 对 象 的 位 置 
Cvspackty 


root .mainloop () 


图 10-17 调整 图 形 对 象 位 置 之 前 和 之 后 的 效果 


@ 移动 指定 图 形 对 象 
使 用 move0 方 法 可 以 移动 图 形 对 象 的 坐标 ， 具 体 语 法 如 下 : 


Canvas 对 象 .move (图 形 对 象 ，x 坐标 偏 移 量 ，Yy 坐标 偏 移 量 ) 
[ 例 ]10-11 移动 指定 图 形 对 象 示 例 ， 运 行 效果 如 图 10-18 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

CVv=Canvas (root, bg="'white', width=200, height=120) 

rtl=cv.create rectangle (20,20,110,110,outline='red',stipple='grayl2", 
fill="'green') 

cv-.pack () 

rt2=cv.create rectangle (20,20,110,110,o0utline='blue') 
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cv.move (rt1,20,—-10) # 移 动 rt1 
cv .pack () 


root .mainloop () 


为 了 对 比 移动 图 形 对 象 的 效果 ， 程 序 在 同一 位 置 绘制 了 两 个 矩形 ， 其 中 矩形 rtl 有 背 
景 伦 约 ， 和 拢 形 rt2 无 背景 填充 ， 然 后 用 move() 方 法 移动 rt1， 将 被 填充 的 矩形 rtl 同 右 移动 
20 像素 、 回 上 移动 10 像素 ， 则 出 现 如 图 10-18 所 示 的 效果 。 

@ 删除 图 形 对 象 

使 用 delete 0 方法 可 以 删除 图 形 对 象 ， 具 体 语 法 如 下 : 


Canvas 对 象 .delete (图 形 对 象 ) 


例如 : 
Cv.delete (rt1) # 删 除 rt1 图 形 对 象 
@ 缩放 图 形 对 象 


使 用 scale() 方 法 可 以 缩放 图 形 对 象 ， 具 体 语法 如 下 : 

Canvas 对 象 .scale (图 形 对 象 ,X 轴 偏 移 量 ,Y 轴 偏 移 量 , x 轴 缩 放 比 例 ,Y 轴 缩 放 比 例 ) 

[ 例 ]10-12 缩放 图 形 对 象 示 例 ， 对 相同 图 形 对 象 放 大 、 缩 小 ， 运 行 效果 如 图 10-19 
所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

CVv=Canvas (root, bg="'white', width=200, height=300) 

rtl=cv.create rectangle(10,10,110,110,outline='red',stipple="'grayl2"', 
fill="'green') 

rt2=cv.create rectangle(10,10,110,110,outline='green',stipple='"'grayl2", 


fil1l1="red') 

er acgle(rtl Dg rT 2) #y 方 回放 大 一 倍 
cv.scale (rt2,0,0,0.5,0.5) # 缩 小 一 半 大 小 
cv .pack () 


root .mainloop() 


图 10-18 移动 指定 图 形 对 象 运 行 效果 图 10-19 ”缩放 图 形 对 象 运行 效果 
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10.4 ”程序 设计 的 步骤 


@ 设计 点 类 Point 
点 类 Point 比较 人 简单， 主要 存储 方块 所 在 棋盘 的 坐标 (x, y)。 


class PonE.: # 点 类 
def init (self,x,y): 
Self .x=x 


self .y=y 
@ 设计 游戏 主 逻 辑 
整个 游戏 在 Canvas 对 象 中 ， 调 用 create_map0 〇 实现 将 图 标 图 双 随 机 放 到 地 图 中 ， 地 图 
map 中 记录 的 是 图 案 的 数字 编号 ， 最 后 调用 print mapO 按 地 图 map 中 记录 的 图 案 信 息 将 
图 10-2 中 的 图 标 图 案 绘 制 在 Canvas 对 象 中 ， 生 成 游戏 开始 的 界面 ， 同 时 绑 定 Canvas 对 象 
的 鼠标 左 键 和 右键 事件 ， 并 进入 窗 体 显示 线程 中 。 
root=Tk () 


root .title("python 连连 看 ") 
imgs=[PhotoImage (file="'H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 


randge(0, 10)1 # 所 有 图 标 图 案 

Select first=False # 是 否 已 经 选中 第 1 块 
firstSselectRectId=-1 # 被 选中 第 1 块 地 图 对 象 
SecondSelectRectId=-1 # 被 选中 第 2 块 地 图 对 象 
Tinepsintstser (| # 存 储 连接 的 折 点 棋盘 坐标 
Tne 1d=11 

Height=9 

Width=10 

map=[[" " for y In range (Height)]for x In range (Width)] 
image map=[[" " for y in range (Height)]for x In range (Width)] 
CVv=Canvas (root, bg="'green', width=610, height=610) 
cv.bind("<Button-1>", callback) # 鼠 标 左 键 事件 
cv.bind("<Button-3>"，find2Block) 鼠标 右键 事件 
CV-pPack() 

create map () # 产 生 map 地 图 

print mapl{) # 打 印 map 地 图 

root .malnloop () 

入 编写 函数 代码 


t 


print map() 按 地 图 map 中 记录 的 图 案 1 
中 ， 生 成 游戏 开始 的 界面 。 
def Print map() : # 输 出 map 地 图 
global image map 


恩 将 图 10-2 中 的 图 标 图 案 显 示 在 Canvas 对 象 


ll 


for x in range(0,Width): 
for y ln range(0,Height): 
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if(maplx] [vl]!=""): 
imgl=imgs [int (map [x] [y]) ] 
id=cv.create image( (x*40+20,y*40+20),image=img1) 
image map[x] [y]=id 
cv=pack() 
for y ln range(0,Height): 
for x in range (0,Width): 
print (map[x] [yl],end="' ') 
1 


用 户 在 窗口 中 单 击 时 ， 由 屏幕 像素 坐标 (event x,event.y) 计 算 被 单 击 方块 的 地 图 棋盘 位 
置 坐标 (x,y)。 判 断 是 否 为 第 1 次 选中 方块 ， 是 则 仅仅 对 选 定 方 块 加 上 蓝 色 的 示意 框 线 。 如 
果 是 第 2 次 选中 方块 ， 则 加 上 黄色 的 示意 框 线 ， 同 时 要 判断 是 否 图 案 相 同 且 连 通 。 假 如 连 
通则 画 选 中 方块 之 间 的 连接 线 , 延 时 0.3 秒 后 清除 第 1 个 选 定 方块 和 第 2 个 选 定 方块 图 案 ， 
并 清除 选中 方块 之 间 的 连接 线 。 假 如 不 连通 ， 则 是 清除 选 定 两 个 方块 示意 框 线 。 

Canvas 对 象 鼠 标 右 键 事件 调用 智能 查找 功能 Find2Block()。 


def find2Block(event) : 间 自 动 查找 
…- # 见 前 面 程序 设计 的 思路 


Canvas 对 象 鼠 标 左 键 事 件 代 码 : 


def callback (event) : # 鼠 标 左 键 事件 代码 
global Select first,pl,p2 
global firstSelectRectId,SecondSelectRectId 
#print ("clicked at", event.x, event.y,turn) 
x (ovenbe zy Aan # 换 算 棋盘 坐标 
y= (event.y)//40 
Berne eeEKREEOG St ox 


if map [X] [y]==" ": 
showinfo (title=" 提 示 ",message=" 此 处 无 方块 ") 
else: 
if Select first==False: 
pl=Point (x, y) 
# 画 选 定 (x1, y1) 处 的 框 线 
firstSelectRectId=cv.create rectangle (x*40,y*40,x*40+40,y*40+ 
40,outline="blue") 
Select first=True 
else: 
p2=Point (x, y) 
# 判 断 第 2 次 单 击 的 方块 是 否 已 被 第 1 次 单 击 选取 ， 如 果 是 则 返回 
if (pl.x==p2.x) and (pl1.y==p2.yY) : 
return 
# 画 选 定 (x2, y2) 处 的 框 线 
print (' 第 2 次 单 击 的 方块 '，, x, y) 
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SecondselectRectIid cv.create rectangle (x*40 YU XUT4D YU 
+40,outline="yellow") 
print (' 第 2 次 单 击 的 方块 ' ,SecondSelectRectId) 
cv=packt) 
if IsSame (pl,p2) and IsLink (pl,p2) : # 判 断 是 否 连 通 
print (' 连 通 ' ,x, y) 
Select first=False 
# 画 选中 方块 之 间 的 连接 线 
drawLinkLine (pl,p2) 
t=Timer (timer interval,delayrun) # 和 定时 函数 


SE 

else: # 不 能 连通 则 取消 选 定 的 两 个 方块 
cv.delete (firstSelectRectId) # 清 除 第 1 个 选 定 框 线 
cv.delete (SecondSelectRectId) # 清 除 第 2 个 选 定 框 线 


Select first=False 


IsSame(p1,p2) 判 断 pl (Xx1, y1) 和 p2(x2, y2) 处 的 方块 图 案 是 含 相同 。 
def IsSame (P1,P2) : 
1f maplpl <IIpl | 一 让 2 2 : 
print ("clicked at IsSame") 
return True 


return False 


以 下 是 男方 块 之 间 的 连接 线 和 清除 连接 线 的 方法 。 

drawLinkLine(p1.p2) 绘 制 p1.p2) 所 在 两 个 方块 之 间 的 连接 线 。 判 断 lnePontStack 列表 
长 度 , 如 条 为 0, 则 是 直接 连通 ; linePointStack 列表 长 度 为 1, 则 是 一 折 连 通 , linePointStack 
存储 的 是 一 折 连 通 的 折 点 ; linePointStack 列表 长 度 为 2， 则 是 两 折 连 通 ，linePointStack 存 
储 的 是 两 折 连 通 的 两 个 折 点 。 


def drawLinkLine (pl,p2): # 男 连接 线 
filentiinepomtstacki 三 个 
Line id.append (dqrawLline (P1,Pp2) ) 
else: 
print (linePointstack,1len (linePointstack)) 
ulientliinepointotaCkEy ly 
z=linePointstack .pop() 
print ("一 折 连 通 点 z",z.x,z.y) 
Line id.append (drawLine (pl,z)) 
Line id.append (drawLine (p2,2z)) 
EilentinepntstEak— 2 
zl=linePointstack .pop() 
prine(t"m 两 析 注 旭 记 之 1” zl x zieY) 
Line id.append (drawLine (p2,2z1)) 
z2=linePointstack.pop() 
EDET i 
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Line id.append (drawLine (zl1,z2)) 
Line id.append (drawLine (pl,z2)) 


drawLinkLine(p1,p2) 绘 制 (p1,p2) 之 间 的 直线 。 


def drawLine (pl,p2): 
Fen OrawDanE Dl D2 pl rr DL vy D2 .xX P22) 
lid=cv.create line (pl .x*40+20,pl .y*40+20,p2 .x*40+20,p2.y*40+20,width=5, 
fil1l="'red') 
#cv .pack () 


return id 
undrawConnectLineO 删 除 Line id 记录 的 连接 线 。 


def narawconneectEILanmeEy 
while len(Line 1id)>0: 
idpop=Line id.pop() 
cv.delete (idpop) 


clearTwoBlockO 清 除 p1,p2) 之 间 的 连 线 及 所 在 方块 的 图 案 。 


def clearTwoBlock () : # 清 除 连 线 及 方块 
# 清 除 第 1 个 选 定 框 线 
cv deLletelfirstSelectRect1id) 
# 清 除 第 2 个 选 定 框 线 
cv.delete (SecondSelectRectId) 
# 清 空 记 录 方 块 的 值 


maplpl-x] [pli-Yl=” 
cv.delete (image mapl[pl.x] [pl.y]) 
map[p2.x] [p2.y]=" " 
cv.delete (image map[p2.x] [p2.Yy]) 
Select first=False 


undrawConnectLine () # 清 除 选中 方块 之 间 的 连接 线 


delayrun0 函 数 是 定时 函数 ， 延 时 timer interval (0.3 秒 ) 后 清除 (p1,p2) 之 间 的 连 线 及 
所 在 方块 的 图 案 。 


timer interval=0.3 #0.3 秒 
def delayrun () : 
clearTwoBlock () # 清 除 连 线 及 方块 


IsWin() 检 测 是 否 尚 有 未 被 消除 的 方块 ， 即 地 图 map 中 的 元 素 值 非 空 《"")， 如 果 没 有 
则 表示 已 经 及 得 了 游戏 。 


# 检 测 是 否 已 经 赢得 了 游戏 


def IsWin () 
# 检 测 是 否 沿 有 未 被 消除 的 方块 
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# ( 非 BLANK STATE 状态 ) 
for y in range(0,Height): 
for x in range (0,Width) : 
1 mplrll = 
return False; 
return True; 
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经 典 的 推 箱子 游戏 是 一 个 来 自 日 本 的 古老 游戏 ， 目 的 是 训练 玩家 的 逻 视频 讲解 
辑 思考 能 力 。 该 游戏 的 思想 是 ， 在 一 个 狭小 的 仓库 中 ， 要 求 把 木 箱 放 到 指定 的 位 置 ， 玩 家 
稍 不 小 心 就 会 出 现 箱子 无 法 移动 或 者 通道 被 堵 住 的 情况 ， 所 以 需要 巧妙 地 利用 有 限 的 空间 
和 通道 合理 安排 移动 的 次 序 和 位 置 ， 这 样 才 能 顺利 地 完成 任务 。 

推 箱子 游戏 的 功能 如 下 : 

游戏 运行 载 入 相应 的 地 图 ， 屏 幕 中 出 现 一 个 推 箱子 的 工人 ， 其 周围 是 围墙 苇 、 人 可 以 
走 的 通道 围 、 几 个 可 以 移动 的 箱子 六 和 箱子 放置 的 目的 地 圈 。 让 玩家 通过 按 上 、 下 、 左 、 
右键 控制 工人 加 推 箱子 ， 当 箱子 都 推 到 了 目的 地 后 出 现 过 关 信息 ， 并 显示 下 一 关 。 如 果 推 
错 了 ， 玩 家 按 空格 键 重新 玩 过 这 关 ， 直 到 过 完全 部 关卡 。 

本 章 开 发 推 箱子 游戏 ， 推 箱子 游戏 界面 如 图 11-1 所 示 。 


图 11-1 推 箱子 游戏 界面 


P,. 项 目 案 例 开 发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


本 游戏 使 用 的 图 片 元 系 的 含义 如 下 : 


国 一 


目的 地 工人 ”箱子 ”通道 ”围墙 ”箱子 已 在 目的 地 


11.2 程序 设计 的 思路 


首先 来 确定 一 下 开发 难点 。 对 工人 的 操作 很 简单 ， 就 是 4 个 方 回 移动 ， 工 人 移动 ， 箱 
子 也 移动 ， 所 以 对 按键 的 处 理 也 比较 人 简单。 当 箱 子 到 达 目 的 地 位 置 时 就 会 产生 游戏 过 关 事 
件 ， 需 要 一 个 逻辑 判断 。 仔 细 地 想 一 下 ， 有 所 有 事件 都 发 生 在 一 张 地 图 中 。 这 张 地 图 包括 了 
箱子 的 初始 化 位 置 、 箱 子 最 终 放 置 的 位 置 和 围墙 障碍 等 。 每 一 关 地 图 都 要 更 换 ， 这 些 位 置 
也 要 变 。 所 以 每 关 的 地 图 数据 是 最 关键 的 ， 它 决定 了 每 关 的 不 同 场景 和 物体 位 置 。 那 么 下 
面 重 点 分 析 一 下 地 图 。 

这 里 把 地 图 想象 成 一 个 网 格 ， 每 个 格子 就 是 工人 每 次 移动 的 步 长， 也 是 箱子 移动 的 距 
离 ， 这 样 问 题 就 简化 多 了 。 首 先 设计 一 个 7x7 的 二 维 列表 myArray， 按 照 这 样 的 框架 来 思 
考 。 对 于 格子 的 x、y 两 个 屏幕 像素 坐标 ， 可 以 由 二 维 列表 下 标 换算 。 

对 于 每 个 格子 的 状态 值 ， 分 别 用 常量 Wall (0) 代表 墙 、Worker (1) 代表 人 、 了 Box (2) 
代表 箱子 、Passageway (3) 代表 路 、Destination (4) 代表 目的 地 、WorkerInDest (5) 代表 
人 在 目的 地 、RedBox(6) 代表 放 到 目的 地 的 箱子 。 在 文件 中 ， 原始 地 图 中 格子 的 状态 值 采 
用 相应 的 整数 形式 存放 。 

在 玩家 通过 键盘 控制 工人 推 箱子 的 过 程 中 ， 需 要 按 游戏 规则 判断 是 否 啊 应 该 按键 指 
示 。 下 面 分 析 一 下 工人 将 会 遇 到 什么 情况 ， 以 便 归 纳 出 所 有 的 规则 和 对 应 算法 。 为 了 描述 
方便 ， 可 以 假设 工人 的 移动 趋势 方 回 为 回 右 ， 其 他 方 同 的 原理 是 一 致 的 。P1、P2 分 别 代 表 
工人 移动 趋势 方 回 前 的 两 个 方 格 。 


@ 前 方 P1 是 通道 
如 果 工 人 前 方 是 通道 ， 工 人 可 以 进 到 P1 方 格 ， 修 改 相 关 位 置 格子 的 状态 值 。 
@ 前 方 Pl1 是 围墙 或 出 界 


如 果 工 人 前 方 是 围墙 或 出 界 〈( 即 阻挡 工人 的 路 线 )， 退 出 规则 判断 ， 布 局 不 做 任何 
改变 。 

@@ 前 方 P1 是 日 的 地 

如 果 工 人 前 方 是 目的 地 ， 工 人 可 以 进 到 了 1 方 格 ， 修 改 相 关 位 置 格子 的 状态 值 。 
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@ 前 方 P1 是 箱子 


在 前 面 3 种 情况 中 ， 只 要 根据 前 方 P1 处 的 物体 就 能 判断 出 工人 是 否 可 以 移动 ， 而 在 
第 4 种 情况 中 ， 需 要 判断 箱子 前 方 P2 处 的 物体 才能 判断 出 工人 是 否 可 以 移动 ， 此 时 有 以 
下 可 能 。 

(1) P1 处 为 箱子 ，P2 处 为 墙 或 出 界 : 如 果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 墙 或 出 界 ， 
退出 规则 判断 ， 布 局 不 做 任何 改变 。 

(2) P1 处 为 箱子 ，P2 处 为 通道 : 如果 工人 前 方 Pl 处 为 箱子 ，P2 处 为 通道 ， 工 人 可 以 
进 到 了 1 方 格 ; P2 方 格 状态 为 箱子 ， 修 改 相 关 位 置 格子 的 状态 值 。 

(3) Pl 处 为 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 目的 地 ， 工 人 
可 以 进 到 了 1 方 格 ，P2 方 格 状态 为 放置 好 的 箱子 ， 修 改 相 关 位 置 格子 的 状态 值 。 

(4) Pl1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 : 如 果 工 人 前 方 P1 处 为 放 到 目的 地 的 箱 
子 ，P2 处 为 通道 ， 工 人 可 以 进 到 Pl 方 格 ; P2 方 格 状态 为 箱子 ， 修 改 相 关 位 置 格 子 的 状 
态 值 。 

(5) P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 Pl 处 为 放 到 目的 地 的 
箱子 ，P2 处 为 目的 地 ， 工 人 可 以 进 到 了 1 方 格 ; P2 方 格 状态 为 放置 好 的 箱子 ， 修 改 相 关 位 
置 格子 的 状态 值 。 

综合 前 面 的 分 析 ， 可 以 设计 出 整个 游戏 的 实现 流程 。 


11.3 ”关键 技术 


在 该 游戏 中 设计 “ 重 玩 ” 功 能 便于 玩家 无 法 通过 时 重 玩 此 关 游 戏 ， 这 时 需要 将 地 图 信 
恩 恢 复 到 初始 状态 , 所 以 需要 将 7x7 的 二 维 列表 myArray 进行 复制 , 注意 此 时 需要 了 解 “ 列 
表 复 制 一 一 深 复制 ”问题 。 


下 面 举 个 例子 。 

问题 摘 述 : 已 知 一 个 列表 a， 生 成 一 个 新 的 列表 b， 列 表 元 又 是 对 原 列表 的 复制 。 
a=[1,2] 

b=a 


这 种 做 法 其 实 并 未 真正 生成 一 个 新 的 列表 ，b 指 同 的 仍然 是 a 所 指向 的 对 象 。 这 样 ， 
如 果 对 a 或 b 的 元 素 进行 修改 ，a、b 列表 的 值 同时 发 生变 化 。 
解决 的 方法 如 下 : 
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a=[1,2] 
b=al[:] # 切 片 ， 或 者 使 用 b=copy .copy (a) 


这 样 修改 a 对 b 没有 影响 ， 修 改 b 对 a 没有 影 啊 。 
这 种 方法 只 适用 于 简单 列表 ， 也 惑 是 列表 中 的 元 系 都 是 基本 类 型 ， 如 朱 列 表 元 系 中 还 
存在 列表 ， 这 种 方法 就 不 适用 了 。 原因 就 是 a[:] 这 种 处 理 只 是 将 列表 元 素 的 值 生 成 一 个 新 的 
列表 ， 如 果 列 表 元 素 也 是 一 个 列表 ， 例 如 a=[1,[2]]， 那 么 这 种 复制 对 于 元 素 [2] 的 处 理 只 是 
复制 [2] 的 引用 ， 并 未 生成 [2] 的 一 个 新 的 列表 复制 。 为 了 证 明 这 一 点 ， 训 试 步骤 如 下 : 


>>> a=[1,; [2] 

>>> b=al[:] 

> 

Flr lz 

>>> al[lll] .append (3) 
> 

Bee bz! 

22> 

Ea be 2 


可 见 , 对 a 的 修改 影响 到 了 Pb。 如 果 要 解决 这 一 问题 ,可 以 使 用 copy 模块 中 的 deepcopy0 
函数 。 修 改 测 试 如 下 : 


>>> import copy 

>>> a=[1, [2]1] 

>>> b=copy .deepcopy (a) 
> 

[| 

>>> alll .append (3) 

>>> a 

DU 

> 

[lL21] 


知道 这 一 点 是 非常 午 要 的 ， 因 为 在 本 游戏 中 需要 一 个 新 的 二 维 列表 现在 状态 地 图 )， 
并 且 对 这 个 新 的 二 维 列表 进行 操作 ， 同 时 不 想 影 响 原来 的 二 维 列表 (原始 地 图 )。 


11.4 ”程序 设计 的 步 又 


@ 设计 游戏 地 图 

整个 游戏 在 7x7 区 域 中 ， 使 用 二 维 列 表 myArray 存储 。 其 中 ， 方 格 状 
态 值 0 代表 墙 ，1 代表 人 ，2 代表 箱子 ，3 代表 路 ，4 代表 目的 地 ，5 代表 ”出 记 字 术 | 
人 在 目的 地 ，6 代表 放 到 目的 地 的 箱子 。 例 如 图 11-1 所 示 的 推 箱子 游戏 界 “” 辐 罕 贡 3 革 
面 的 对 应 数据 如 下 : 


视频 讲解 
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方 格 状 态 值 采用 myArrayl 存储 注意 按 列 存 储 ): 


# 原 始 地 图 

TyArrayvi=TloOr3 1 4 2373.31. 
[0,3,3,2,3,3,0], 
[0,0,3,0,3,3,0], 
[3,3,2,3,0,0,0], 
[3,4,3,3,3,0,0], 
[0,0,3,3,3,3,0], 
[0,0,0,0,0,0,0]] 


为 了 明确 表示 方 格 状态 信息 ， 这 里 定义 变量 名 (Python 没有 枚 举 类 型 ) 来 表示 ， 并 使 
用 imgs 列表 存储 图 像 ， 而 且 按 照 图 形 代 号 的 顺序 储存 图 像 。 


Wall=0 
Worker=1 
Box=2 
Passageway=3 
Destination=4 
WorkerIinDest=5 
RedBox=6 
# 原 始 地 图 
mvArravi=i0 3 1 A403 3.31. 
[0,3,3,2,3,3,0], 
[0,0,3,0,3,3,0], 
[3,3,2,3,0,0,0], 
[3,4,3,3,3,0,0], 
[0,0,3,3,3,3,0], 
[0,0,0,0,0,0,0]] 
imgs=[PhotoImage (file="'bmp\\Wall .gif'"), 
PhotoImage (file='bmp\\Worker.gif"), 
PhotoImage (file='bmp\\Box.gif'"), 
PhotoImage (file='bmp\\Passageway.9g1if"), 
PhotoImage (file='bmp\\Destination.gif'"), 
PhotoImage (file='bmp\\WorkerIinDest .gif"), 
PhotoImage (file='bmp\\RedBox.gif")] 
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从 绘制 整个 游戏 区 域 图 形 
绘制 整个 游戏 区 域 图 形 就 是 按照 地 图 myArray 储存 图 形 代 号 ， 从 imgs 列表 获取 对 应 
图 像 ， 显 示 到 Canvas 上 。 全 局 变量 x、y 代表 工人 当前 位 置 ， 即 (x,y)， 从 地 图 myArray 读 
取 时 如 果 是 1 (Worker 值 为 1 )， 则 记录 当前 位 置 。 


def drawGamelImage () : 


global x,y 
for In rangqe(g TD 才 0 一 6 
for ] in range (0,7) : #0~6 
if myArrayl[i] []]==Worker : 
= # 工 人 当前 位 置 (x, y) 
下 
Print(" 工人 当前 位 置 :”,X,Y) 
imgl=imgs [myArray[i][]j]] # 从 imgs 列表 获取 对 应 图 像 
cv.create image( (i*32+20,j*32+20),，,image=imgl) # 显 示 到 Canvas 上 
CV.Pack () 
@ 按键 事件 处 理 


在 游戏 中 对 于 用 户 按 键 的 操作 采用 Canvas 对 象 的 KeyPress 按键 事件 处 理 。KeyPress 
按键 处 理 函 数 callbackO 根 据 用 户 的 按键 消息 计算 出 工人 移动 趋势 方向 前 两 个 方 格 的 位 置 
坐标 (x1, y1)、(x2, y2), 将 所 有 位 置 作为 参数 调用 MoveTo(x1, yl1, x2, y2) 判 断 并 做 地 图 更 新 。 
如 果 用 户 按 空格 键 ， 则 恢复 游戏 界面 到 原始 地 图 状态 ， 实 现 “ 重 玩 ” 功 能 。 


def callback(eventy # 按 键 处 理 
# (X1，Y1) 、(x2，Y2) 分 别 代表 工人 移动 趋势 方向 前 的 两 个 方 格 
global x,y,myArray 
print (" 按 下 键 : ” ) 
print (" 按 下 键 : "，event .char) 
KeyCode=event .keysym 
# 工 人 当前 位 置 (x, y) 
if KeyCode=="Up": # 分 析 按 键 消息 
# 疝 上 

Xl1=x; 

yl=y-1; 

X2=X;? 

y2=y-—2; 

# 将 所 有 位 置 输入 以 判断 并 做 地 图 更 新 

MoveTo(xle Vi XA V2 
# 册 下 
elif KeyCode=="Down": 

Xl1=x; 

yl=y+1; 

X22=X;? 

y2=y+2; 

MoveTo (zl oo VL XO VA 
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# 回 左 
elif KeyCode=="Left": 
xl1=x—1; 
WE 
一 
y2=Yy; 
MOVeETOXT VI x VV) 
# 癌 右 
elif KeyCode=="Right": 
xXxl1=x+1; 
yA 
XxX2=Xx+2;? 
Vas 
MoOveTO(xl vl X27r VA)s 
elif KeyCode=="Space": # 空 格 键 
print (" 按 下 键 : "，event .char) 
myArray=copy .deepcopy (myArrayl) # 恢 复原 始 地 图 
drawGameImage () 


IsInGameArea(row, coD) 判 断 是 否 在 游戏 区 域 中 。 


def IsInGameArea (row, CoO1) 


return (row>=0 and row<7/ and col>=0 and col<7) 
MoveTo(x1,y1,X2,y2) 方 法 是 最 复杂 的 部 分 ， 实 现 前 面 分 析 的 所 有 规则 和 对 应 算法 。 


def MoveTo (xl1l, yl, x2, y2) 


global x,y 

Pl=None #P1、P2 是 移动 趋势 方 回 前 的 两 个 格子 
P2=None 

if IsInGameArea (x1, y1) : # 判 断 是 否 在 游戏 区 域 


P1=myArray[xlL]j] [yl1]; 
1if IsInGameArea (x2, y2) 
P2=myArray[x2] [y2]; 
if Pl==Passageway : #P1 处 为 通道 
MoveMan (x, y); 
X=X1L7 y=yl; 
myArray[lxl] [yl1]=Worker; 
LE IDeatination #P1l1 处 为 目的 地 
MoveMan (x, y); 
x=xl1; y=yl; 
myArraylxl] [yl]=WorkerIinDest; 
if Pl==Wall or not IsInGameArea (xl, yl1) 
#P1 处 为 墙 或 出 界 
return; 
if Pl BO < #P1 处 为 箱子 
if P2==Wall or not IsInGameArea (X1，y1) or P2==Box:#P2 处 为 墙 或 出 界 
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return; 
# 以 下 P1 处 为 箱子 
#P1 处 为 箱子 ，P2 处 为 通道 
if Pl==Box and P2==Passageway : 
MoveMan (x, y); 
Xx=xl1; y=yl; 
myArray[lx2] [y2]=Box; 
myArraylxl] [yl]=Worker; 
if Pl==Box and P2==Destination : 
MoveMan (x, y); 
x=xl1; y=yl; 
myArray[lx2] [y2]=RedBox; 
myArraylxl] [yl]=Worker; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 
1f Pl==RedBox and P2==Passageway : 
MoveMan (x, y); 
x Xl Vy 
myArray[lx2] [y2]=Box; 
myArraylxl] [yl]=WorkerIinDest; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 
if Pl==RedBox and P2==Destination : 
MoveMan (x, y); 
x=xl1; y=yl; 
myArray[x2] [y2]=RedBox; 
myArraylxl] [yl]=WorkerinDest; 
drawGameImade () 
# 这 里 要 验证 是 否 过 关 
ff TSFinisht() 
showinfo (tit1le=" 提 示 ",messagqe=" 蕉 喜 你 顺利 过 关 " ) 
rb i bl ed, 


MoveMan(x,y) 移 走 位 置 为 (x, y) 的 工人 ， 修 改 格 子 状态 值 。 


def MoveMan (x, Y) 
if myArray[X] [y]==Worker : 
myArray[lx] [y]=Passageway; 
elif myArrayl[lx] [yl]==WorkerIinDest : 
myArray[x] [y]=Destination; 


IsFinish() 验 证 是 否 过 关 ， 只 要 方 格 状 态 存 在 目的 地 (Destination) 或 人 在 目的 地 上 
(WorkerInDest)， 则 表明 有 没 放 好 的 箱子 ， 游 戏 还 未 成 功 ， 否 则 成 功 。 
def IsFinish() : # 验 证 是 否 过 关 
bFinish=True; 


for syL an Tranget0s 7 0 一 6 
Or rangete 1): #0 一 6 
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If (myArray[i][]j]]==Destination 
or myArray[i] []]==WorKkerInDest) 
brinish=Falses 


return bFinish; 


@ 主 程序 


root=Tk () 

root .title("” 推 箱子 一 夏 敏 捷 ") 

CVv=Canvas (oot，bgq='gqreen'，WwWidth=226，helght=226) 
myArray=copy .deepcopy (myYATrTaVYyl) 

drawGamelmage () 

cv.bind("<KeyPress>", callback) 

cv .pack () 

cv.focus set() # 将 焦点 设置 到 cv 上 


root .mainloop () 


至 此 完成 推 箱子 游戏 。 读 者 可 以 考虑 一 下 多 关 推 箱子 游戏 如 何 开 友 ， 例 如 把 10 关 游 戏 的 
地 图 信息 存储 在 map.txt 文件 里 ， 需 要 时 从 文件 中 谈 取 下 一 关 数 据 即 可 。 
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12.1 抹 将 游戏 介绍 


腑 将 起 源 于 中 国 ， 它 集 益 知性、 趣味 性 、 博 穿 性 于 一 体 ， 是 中 国 传统 
文化 的 一 个 重要 组 成 部 分 , 不 同 地 区 的 游戏 规则 稍 有 人 不同。 麻将 牌 每 副 136 张 , 主要 有 “人 饼 
〈 文 钱 ) ”“ 条 【〈 索 于) “万 〈 万 贯 )” 等 。 与 其 他 牌 形式 相 比 ， 朵 将 的 玩法 最 为 复 杀 、 有 趣 ， 
它 的 基本 打 法 简单 ， 因 此 成 为 中 国 历史 上 最 能 吸引 人 的 博 戏 形 式 之 一 。 


12.1.1 麻将 术语 


肪 将 术语 是 “ 吃 ”“ 磁 ”"”“ 杠 ”“ 听 ”。 

。 号 : 如 果 任 何 一 位 选手 手中 的 牌 的 两 张 加 上 上 家 选手 刚 打 下 的 一 张 牌 恰好 成 顺 子 ， 
他 就 可 吃 牌 。 

。 健 : 如 果 东 方 打出 一 张 牌 ,而 自己 手中 有 两 张 以 上 与 该 牌 相同 的 牌 ， 可 以 选择 全 牌 。 
全 牌 后 ， 取 得 对 方 打 出 的 这 张 牌 ， 加 上 目 己 提供 的 两 张 相同 的 牌 成 为 刻 子 ， 倒 下 这 
个 刻 子 ， 不 能 再 出 。 然 后 再 出 一 张 牌 。“ 碰 ” 比 “ 吃 ” 优 先 ， 如 果 要 碰 的 牌 刚好 是 
出 牌 方 下 家 要 吃 的 有 牌 ， 则 吃 牌 失败 ， 碰 牌 成 功 。 

。 杠 : 其 他 人 打出 一 张 牌 ， 目 己 手 中 有 3 张 相 同 的 牌 ， 即 可 杠 牌 。 杠 牌 分 明 杠 和 暗 杠 
两 种 。 

。 听 : 当 将 手中 的 牌 都 次 成 了 有 用 的 牌 ， 只 需 再 加 上 第 14 张 便 可 和 牌 ， 则 玩家 就 可 
以 进入 听 牌 的 阶段 。 


12.1.2 ” 脾 数 


麻将 共 136 张 牌 。 
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(1) 万 牌 : 从 一 万 至 九 万 ， 各 4 张 ， 共 36 张 。 

(2) 饼 牌 : 从 一 饼 至 九 饼 ， 各 4 张 ， 共 36 张 。 

(3) 条 牌 : 从 一 条 至 九条 ， 各 4 张 ， 共 36 张 。 

(4) 风 牌 : 东 、 南 、 西 、 北 ， 各 4 张 ， 共 16 张 。 

(5) 字 牌 : 中 、 发 、 白 ， 各 4 张 ， 共 12 张 。 

本 章 设 计 的 是 两 傈 将 程序 ， 可 以 实现 玩家 (人 ) 和 计算 机 对 下 。 游 戏 有 吃 、 碰 功能 ， 
和 牌 〈 即 胡 牌 ) 判断 。 为 了 降低 程序 的 复杂 度 ， 游 戏 没有 设计 杠 的 功能 。 同 时 对 计算 机 出 
牌 进行 了 智能 设计 ， 游 戏 中 上 方 为 计算 机 的 有 牌 下方 为 玩家 的 有 牌 ， 有 “ 吃 牌 ”“ 碰 牌 ”“ 和 
牌 ”“ 摸 牌 ” 和 “出 牌 ” 按 钮 供 玩家 选择 ， 游 戏 初 始 界面 如 图 12-1 所 示 。 


省 两 人 府 将 -更 敏 汪 


图 12-1 两 人 麻将 游戏 运行 的 初始 界面 


12.2 ”两 人 及 将 游戏 设计 的 思路 
12.2.1 素材 图 片 


肥 将 牌 共 136 张 。 万 子 牌 从 一 万 至 九 万 ， 饼 子 牌 从 一 饼 至 九 饼 ， 条 子 牌 从 一 条 全 九条 ， 
字 牌 有 东 、 南 、 西 、 北 和 中 、 发 、 白 。 在 设计 时 麻将 牌 图 片 文件 按 以 下 规律 编号 : 一 饼 至 
九 饼 为 11jpg 一 19.jpg， 一 条 至 九条 为 21jpg 一 29.jpg， 一 万 至 九 万 为 31.jpg 一 39.jpg， 字 牌 
为 41.jpg 一 47.]pg， 如 图 12-2 所 示 。 


225 | 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 
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图 12-2 素材 图 片 


12.2.2 ” 洲 戏 的 运 辑 实现 


完 牌 则 MyTum= Tme， 同 时 “ 摸 牌 ”按钮 有 效 ， 这 样 义 轮 到 玩家 出 有 牌 。 视频 讲解 


MyTurn=True # 轮 到 玩家 出 牌 
Get btn["state"]=NORMAL # 摸 牌 有 效 


在 游戏 过 程 中 ， playersCard 列表 (数组 ) 记录 两 个 和 脾 手 的 有 牌 ， 其 中 playersCard[0] 记 
录 玩 家 自己 〈0 号 牌 手 ) 的 牌 ，playersCard[1] 记 录 计 算 机 (1 号 牌 手 ) 的 牌 。 同 理 ， 
playersOutCard 数组 记录 两 个 牌 手 出 过 的 牌 。 所 有 的 牌 存 入 m_aCards 列表 (数组 )， 同 时 
为 了 便于 知道 该 发 哪 张 牌 ， 这 里 k 记录 已 发 牌 的 个 数 ， 从 而 知道 要 换 的 牌 是 m_aCards[k]。 


12.2.3 ” 碰 / 吃 牌 的 判断 


在 游戏 过 程 中 玩家 目 己 可 以 碰 有 牌 和 吃 牌 ， 所 以 需要 判断 计算 机 〈1 号 牌 手 ) 刚 出 的 牌 
玩家 是 否 可 以 磁 、 吃 ， 如 果 能 够 磁 、 吃 ， 则 “ 碰 牌 ”“ 吃 有 牌 ” 和 “ 摸 脾 ”按钮 有 效 。 

能 否 碰 牌 的 判断 比较 人 简单， 由 于 每 张 牌 对 应 文件 的 主 文 件 名 是 imageID， 上 所 以 仅仅 统 
计 相 同 imageID 的 牌 即 可 知道 是 个 有 两 张 以 上 ， 如 果 有 则 可 以 碰 牌 。 


# 是 否 可 以 碰 有 牌 
def canPeng (a,card):#(List a,Card card) 
n=0 
for 1 in range(0,1len(a)): 
EL 
if(c.imageID==card.imageID): 
n+=1 
1 ne 
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return True 
print ("不 能 碰 牌 1!!!1", card.imageID) 


return False 


能 侣 吃 牌 的 判断 也 比较 简单 ， 由 于 牌 手 手 里 的 牌 〈a 列表 ) 已 经 排 过 序 了 ， 只 要 判断 
以 下 3 种 情况 : 

] ** 

米 ] * 


玉米 ] 
1 代表 对 方刚 出 的 牌 ， 如 果 符 合 这 3 种 情况 则 可 以 吃 牌 。 
是 否 可 以 吃 牌 


def canChi (a,card): 
n=0 
if card.m nType==4: # 字 牌 不 用 判断 吃 
return False 
for 1 in range(0,1len(a)—1): #1** 
Ed 
2=9 LEI 
if(cl.m nNum==card.m nNum+l and cl.m nType==card.m nType 
and c2.m nNum==card.m nNumt+2 and c2.m nType==card.m nType): 
return True 
for 1I In range(0,1len(a)—1): #*]1* 
cl=a[il] 
Cc2=a [i+1] 
if(cl.m nNum==card.m nNum-1 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNumt+l1 and c2.m nType==card.m nType): 
return True 
for 1 In range(0,1len(a)—1): #**] 
cl=a[il] 
C2=a[1i+1] 
if(cl.m nNum==card.m nNum-2 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum-1 and c2.m nType==card.m nType): 
return True 
print ("不 能 吃 牌 1!11", card.imageID) 
return False 


12.2.4 ”和 牌 算法 


@ 数据 结构 的 定义 

麻将 由 “万 ”“ 饼 ”( 简 ) “条”( 索 )“ 字 ”4 类 牌 组 成 ， 其 中 “万 ”又 。 ”视频 讲解 
分 为 “一 万 ” ~“ 九 万 ” 各 4 张 ， 共 36 张 ,“ 饼 ”和 “条 ”类 似 ,“ 字 ”又 分 为 “ 东 ”“ 南 ” 
“ 西 ”“ 北 ”“ 中 ”“ 发 "“ 白 ”各 4 张 ， 共 28 张 。 
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这 里 定义 了 一 个 4x10 的 三 维 列 表 ( 相 当 于 其 他 语言 中 的 4x10 的 二 维 数 组 
int allPai [4][10])， 它 记录 了 有 牌 手 手 中 的 牌 的 全 部 信息 ， 行 号 记录 类 别 信 息 ， 第 0 一 3 行 分 
别 代表 “人 饼 ”“ 条 ”万 ”“ 字 ”。 

以 第 2 行为 例 ， 它 的 第 0 列 记录 了 有 牌 中 所 有 “万 ”的 总 数 ， 第 1 一 9 列 分 别 对 应 “一 
万 ”一 “ 九 万 ”的 个 数 ,“ 饼 ”和 “和 条” 类似。“ 字 ”不 同 的 是 第 1 一 7 列 对 应 的 是 “中 ”发 ” 
“ 白 ”“ 东 ”“ 南 ”“ 西 ”“ 北 ”的 个 数 ， 第 8、9 列 恒 为 0。 

根据 麻将 的 规则 ， 数 组 中 牌 的 总 数 一 定 为 3n+2， 其 中 n=0,1,2,3,4。 例 如 有 以 下 数组 : 

| 

[6.151.1.0.31。 4 鲜 ， 6 个 怕 牌 >“ 一 要 ” “三 供 *" “三 俐 ”和 3 个 “十 饼 * 
2 # 条 ，5 个 条 牌 ， 两 个 “二 条 ”和 3 个 “四 条 ” 

[0], # 万 ， 无 万 牌 

[i # 字 ，3 个 字 牌 “发 ” 

] 

它 表 示 牌 手 手中 的 牌 为 “一 饼 ”“ 二 饼 ”“ 三 饼 ”“ 五 饼 ”“ 五 饼 ”“ 五 饼 ”，“ 二 条 ”“ 二 
条 ”“ 四 条 ”四 条 ”“ 四 条 ”“ 发 “发 “发 "”， 共 6 张 “ 人 饼 ” 5 张 “ 条 ”0 张 “ 万 ”3 
张 “ 字 ”。 

@ 算法 设计 

由 于 “七 对 子 ”“ 十 三 和 ”这 种 特殊 牌 型 的 和 牌 依据 不 是 牌 的 相互 组 合 ， 而 且 规 则 也 
不 尽 相 同 ， 这 里 将 这 类 情况 排除 在 外 。 

尽管 能 构成 和 牌 的 形式 千变万化 ， 但 稍 加 分 析 可 以 看 出 它 离 不 开 一 个 模型 : 可 以 分 解 
为 “三 、 三 …… 三 、 二 ”的 形式 (总 牌 数 为 3n+2 张 )， 其 中 的 “三 ”表示 的 是 “ 顺 ” 或 “ 刻 ” 
(连续 3 张 牌 叫 作 “ 顺 ” 例如 “三 饼 ”“ 四 人 饼 ”“ 五 饼 ”,“ 字 ”有 牌 不 存在 “ 顺 ” 3 张 同样 的 
牌 叫 作 “ 刻 ” 例如 “三 饼 ”“ 三 饼 ”“ 三 饼 ”)， 其 中 的 “二 ”表示 的 是 “将 ”( 两 张 相同 的 
牌 可 作为 “将 ” 例如 “三 饼 ”“ 三 饼 ”)。 

在 代码 实现 中 ， 首 先 判断 牌 手 手中 的 牌 是 否 符合 这 个 模型 ， 这 样 就 用 极 少 的 代价 排除 
了 大 多 数 情况 ， 有 具体 方法 是 用 3 除 alPai [ij[0]《〈 存 储 每 种 牌 型 数量 )， 其 中 10, 1,.2,.3， 只 
有 在 余数 有 且 仅 有 一 个 为 2， 其 余 全 为 0 的 情况 下 才 可 能 构成 和 牌 。 

对 于 余数 为 0 的 牌 ， 它 一 定 要 能 分 解 成 一 个 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 是 一 个 递归 的 
过 程 ， 由 函数 bool Analyze(listbool) 处 理 。 

对 于 余数 为 2 的 牌 ， 一 定 要 能 分 解 成 一 对 “将 ”与 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 由 于 任何 
数目 大 于 等 于 2 的 牌 均 有 作为 “将 ”的 可 能 ， 需 要 对 每 张 牌 进行 轮 询 ， 如 果 它 的 数目 大 于 
等 于 2， 去 掉 这 对 “将 ”后 再 分 析 它 能 否 分 解 为 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 个 过 程 的 开销 
相对 较 大 ， 放 在 了 程序 的 最 后 进行 处 理 。 在 递归 和 轮 询 过 程 中 ， 尽 管 每 次 去 掉 了 某 些 牌 ， 
但 最 终 都 会 再 次 将 这 些 牌 如上， 使 得 数组 中 的 数据 保持 不 变 。 

最 后 分 析 递 归 函 数 bool Analyze(lisbbooD,， 列表 (数组) 参数 表示 一 类 牌 , 即 “ 万 ”“ 饼 ” 
“条 ”“ 字 ”之 一 ， 布 尔 参 数 指出 列表 (数组 ) 参数 是 否 为 “ 字 ” 牌 ， 这 是 因为 “ 字 ” 牌 只 
能 “ 刻 ” 不 能 “ 顺 ”。 对 于 列表 (数组 ) 中 的 第 1 张 牌 ， 如 果 要 构成 和 牌 ， 它 就 必须 与 其 他 
牌 构成 “ 顺 ” 或 “ 刻 ”。 
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如 果 数 目 大 于 等 于 3， 那么 它们 一 定 是 以 “ 刻 ” 的 形式 组 合 。 例 如 当前 有 3 张 “ 五 万 ”， 
如 果 它 们 不 构成 “ 刻 ” 则 必须 有 3 张 “ 六 万 ”3 张 “ 七 万 ”与 其 构成 3 个 “ 顺 ”( 注 意 此 
时 “五 万 ”是 数组 中 的 第 1 张 牌 )， 否 则 就 会 剩 下 “五 万 ”不 能 组 合 ， 而 此 时 的 3 个 “ 顺 ” 
实际 上 也 是 3 个 “ 刻 ”。 去 掉 这 3 张 牌 ， 递 归 调 用 bool Analyze(list,bool) 函 数 ， 如 果 成 功 则 
和 牌 。 当 该 牌 不 是 字 牌 且 其 下 两 张 牌 均 存在 时 它 还 可 以 构成 “ 顺 ” 去 掉 这 3 张 牌 ， 递 归 调 
用 bool Analyze (lisbbool) 函 数 ， 如 果 成 功 则 和 牌 。 如 果 此 时 还 不 能 构成 和 牌 ， 说 明 该 牌 不 
能 与 其 他 牌 顺利 组 合 ， 传 入 的 参数 不 能 分 解 为 “ 顺 ” 和 “ 刻 ” 的 组 合 ， 不 可 以 构成 和 牌 。 

这 里 根据 上 述 思想 单独 设计 一 个 类 文件 (huMain py) 验证 和 牌 算法 ， 代 码 如 下 : 


chass hoaMaiml)® 
def init (self): 
# 定 义 牌 手 手中 的 牌 int allPai[4] [10] 
self.allPai=[[6,1,4,1,0,0,0,0,0,0]， 
[3,1,1,1,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0], 
[3,2,3,0,0,0,0,0,0,0]1] 
Ff self Winlself allpaly: 
PEnet gun” ) 
else: 
BrintlnnoC na ny 
# 判 断 是 否 和 有 牌 的 函数 
def Win(self,allPai): 
JiangPos=0 
JiangExisted=False 
# 是 否 满 足 3, 3, 3, 3, 2 模型 
for 1 in ranget(t0ya): 
#yuSshu 
yuSshu=allPai[i][0]%$3 
if YuShu==l1 : 
return False 
if yuShu== 
if JiangExisted==True: 
return False 
J]iangPos=1 


JiangExisted=True 


# 不 含 “ 将 ”处 理 
for 1 in range(0,4): 


if 1i!=jiangPos : 


# 构 造 函 数 


# 饼 
# 条 


# 万 
于 


#“ 将 ”的 位 置 


# 余 数 


# 不 满足 3，3，3，3，2 模型 


# 不 满足 3，3，3，3，2 模型 
#“ 将 ”在 哪 行 


if not self.Analyze (allPali[i],1==3): 


return False 


# 该 类 有 牌 中 要 包含 “将 ”， 因 为 要 对 “将 ”进行 轮 询 ， 效 率 较 低 ， 放 在 最 后 
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success=False # 指 出 除 掉 “ 将 ”后 能 否 通过 
for J mn range(l .107}- # 对 列 进行 操作 ， 用 j 表示 


if (allPai[jiangPos] []]>=2) : 

# 除 去 这 两 张 将 有 牌 

allPai [jiangPos] []j]-=2 

allPai [jiangPos] [0]-=2 

if self.Analyze (allPai[JjiangPos],]J]iangPos==3) 
success=True 

# 还 原 这 两 张 将 牌 

allPai [jiangPos] []]+=2 

allPai [jiangPos] [0]+=2 

if success==True : 


break 


return success 


# 分 解 成 “ 刻 ”“ 顺 ”组 合 
def Analyze (self,aKindPai,ziPai): #(int aKindPal[],Boolean ziPali) 
1 


return True 


# 寻 找 第 1 张 牌 


for Ty in rangell, 10): 


if aKindPai[]j]]!=0: 


break 


i Rindpailil>=3: # 作 为 刻 牌 


# 除 去 这 3 张 刻 牌 
aKlindPal [] ] -=3 
aKindPai[0]-=3 
result=self.Analyze (aKindPai,ziPal) 
# 还 原 这 3 张 刻 牌 
aKindPal[]]+=3 
aKindPai[0]+=3 


return result 


# 作 为 顺 牌 


if(not ziPai)and(]j]<8) and(aKindPai[j+1]>0) and (aKindPai [Jj+2]>0): 


# 除 去 这 3 张 顺 牌 
aKlindPal [] ] -=1 
aKindPai[]j+1]-=1 
aKindPai[]j+2]-=1 
aKindPai[0]-=3 
result=self.Analyze (aKindPai,Zz1iPai) 
# 还 原 这 3 张 顺 牌 
aKindPai[]j]+=1 
aKindPai[]jJ+1]+=1 
aKindPai[]jJ+2]+=1 
aKindPai[0]+=3 
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reEurn reasulEe 


return False 


12.2.5 ”实现 计算 机 智能 出 牌 


在 游戏 中 有 两 个 牌 手 ， 一 个 是 玩家 自己 (0 号 牌 手 )， 一 个 是 计算 机 (1 号 牌 手 )。 如 
果 计 算 机 只 能 随机 出 牌 ， 则 游戏 的 可 玩 性 较 差 ， 所 以 智能 出 牌 是 一 个 设计 重点 。 

为 了 判断 出 牌 ， 需 要 首先 计算 牌 手 手 中 各 种 牌 型 的 数量 。 二 维 列 表 paiArray 存储 了 和 
牌 算 法 的 数据 结构 ， 记 录 了 牌 手 手中 牌 的 全 部 信息 ， 行 号 记录 类 别 信息 ， 第 0 一 3 行 分 别 代 
表 “ 饼 ”“ 索 ”“ 万 ”“ 字 ”。 本 游戏 这 里 给 出 一 个 智能 出 牌 的 算法 : 

假设 cards 为 手中 所 有 的 牌 。 

(1) 判断 字 牌 的 单 张 ， 即 paiArray 行 号 为 3 的 元 素 是 否 为 1， 有 则 找到 ， 返 回 在 cards 
的 索引 号 。 

(2) 判断 顺 子 、 刻 子 (3 张 相同 的 )， 有 则 从 paiArray 中 消去 ， 即 不 需要 考虑 这 些 牌 。 

(3) 判断 单 张 非 字 牌 ( 饼 、 条 、 万 )， 有 则 找到 ， 返 回 在 cards 中 的 索引 号 。 

(4) 判断 两 张 牌 〈 饼 、 条 、 万 ， 包 括 字 牌 )， 有 则 找到 《〈 即 拆 双 牌 )， 返 回 在 cards 中 
的 索引 号 。 

(5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 ， 当 然 此 种 情况 一 般 不 会 出 现 。 

# 计 算 机 智能 出 牌 v1.0， 计 算出 牌 的 索引 号 


def ComputerCard(cards): 
# 计 算 牌 手 手中 各 种 牌 型 的 数量 
aaarray= [0 .0000.00 0 0.01 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0]] 
for 1 In range(0,14): 
Earc eCardeTrd 
if (card.imageID>10 and card.imageID<20): # 包 | 
paiArray[0] [0]1+=1 
paiArray[0] [card.imageID-10]+=1 
if (card.imageID>20 and card.imageID<30): # 条 
paiArray[1] [0]+=1 
PalArray[1] [card.imageID-20]+=1 
if (card.imageID>30 and card.imageID<40): 手记 
paiArray[2] [0]1+=1 
paiArray[2] [card.imageID-30]+=1 
if (card.imageID>40 and card.imageID<50): # 字 
paiArray[3] [0]1+=1 
paiArray[3] [card.imageID-40]+=1 
Print (paiArray) 
# 计 算 机 智能 选 牌 
#《〈1) 判断 字 牌 的 单 张 ， 有 则 找到 
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for ] ln Frange(1,10) : 
if (paiArray[3] []]==1) : 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards, 3+1,]) 
return k 
#《2) 判断 顺 子 、 刻 子 (3 张 相同 的 ) 
for Lin range(0 3): 
for ] in range(l1,10): 
if (paiArray[i][]j]>=3): # 刻 子 
paiArray[1i][]]-=3 
if (Jj<=7 and palArray[1][]]>=1 and paiArray[i][]+1]>=1 
and paarrav[lr1t 213=1)2 4 二 
paiArray[1i][]]-=1 
paiArray[i] [Jj+1]-=1 
paiArray[1i] [Jj+2]-=1 
#《3) 判断 单 张 非 字 有 牌 ( 饼 、 条 、 万 );， 有 则 找到 
for 1 in range(0,3): 
For J ein rangqell 10) 
i1f (paiArray[i][]]==1): 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards,1+1,]) 


return k 


#《4) 判断 两 张 牌 〈 饼 、 和 条、 万， 包括 字 牌 )， 有 则 找到 ， 拆 双 牌 
for i in range(3,-1): 
for ] in range(1,10): 
if (palArray[1I][]]==2) : 
# 获 取 在 手中 的 牌 的 位 置 下 标 


k=ComputerSelectCard (cards,1+1,]) 


return k 


# 《5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 
# 随 机 选 出 1 张 牌 


k=random.randint (0,13) 


return k 


# 根 据 牌 (花色 nType， 点 数 nNum) 找 在 a 数组 中 的 索引 位 置 
def ComputerSelectCard(a, nType,nNum): 
for 1 in range(0,1len(a)): 


carg— alal 
if(card.m nType==nType and card.m nNum==nNum): 


return 1 


return -1 
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12.3 关键 技术 
12.3.1 声音 的 播放 


winsound 模块 可 以 访问 由 Windows 平台 提供 的 基本 的 声音 播放 设备 , 它 包 含 数 个 声音 
@ Beep(frequency, duration) 打数 
计算 机 蜂 鸣 器 。 其 中 ，frequency 参数 指定 声 首 的 频率 ， 单 位 为 赫兹 ， 并 且 必 须 在 37 一 
32767 的 范围 之 中 ; duration 参数 指定 声音 应 该 持续 的 毫秒 数 。 
@ PlaySound(sound, flags) 国 数 
从 Windows 平台 API 中 调用 PlaySound() 函 数 。 其 中 ,sound 参数 必须 是 一 个 由 文件 名 、 
音频 数据 形成 的 字符 串 ， 或 为 None。 它 的 解释 依赖 于 flags 的 值 ， 该 值 可 以 是 一 个 位 方式 
或 下 面 变 量 的 组 合 。 
SND FILENAME: sound 参数 是 一 个 WAV 文件 的 文件 名 。 
SND LOOP: 重复 地 播放 声音 。 
SND MEMORY: 提供 给 PlaySound0 的 sound 参数 是 一 个 WAV 文件 的 内 存 映像 形 
成 的 字符 串 。 
SND_ PURGE: 停止 播放 所 有 指定 声音 的 实例 。 
SND ASYNC: 立即 返回 ， 人 允许 声音 异步 播放 。 
SND_NOSTOP: 不 中 断 当 前 播放 的 声音 。 
MB ICONASTERISK: 播放 SystemDefault 声音 。 
。 MB ICONEXCLAMATION: 播放 SystemExclamation 声音 。 
例如 播放 八 柄 .wav 声音 文件 的 代码 如 下 : 
import winsound 
wlnsound.P1aySound ("res\\sound\\ 八 柄 .wav"，winsound . SND FILENAME) 


12.3.2 ”返回 对 应 位 置 的 组 件 


在 Python Tkinter 中 鼠标 单 击 某 组 件 ， 如 何 得 到 对 应 位 置 的 组 件 呢 ? 

实际 上 ， 当 鼠标 单 击 ， 参 数 event 的 event.x 和 event.y 可 以 获取 鼠标 坐标 的 时 候 ， 
event.widget 返回 的 就 是 事件 发 生 时 所 在 的 组 件 ， 也 就 是 被 用 户 单 击 的 组 件 。 

例如 当 用 户 选 蚊 将 牌 时 ， 系 统 上 自动 调用 鼠标 按 下 事件 函数 ， 其 中 将 被 单 击 的 采 将 牌 上 
移 20 像素 。 如 果 此 麻将 牌 已 被 选 过 ， 则 下 移 20 像素 恢复 到 原来 的 正常 位 置 。 


def btn MouseDown (event) : “ 间 鼠 标 单 击 按 下 事件 函数 


# 找 到 相应 的 麻将 有 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
card.y-=20 # 上 移 20 像素 


card.place (x=event .widget .x,y=event .widget.y) 


233 | 


| 项 目 案 例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


if (m LastCard==None): # 未 选 过 的 有 牌 
m LastCard=card 
PlayerSelectCard=card 
else: # 已 经 选 过 的 有 牌 
m LastCard.MoveTo(m LastCard.getX(};m LastCard.getY ()1+20) # 下 移 20 像素 
m LastCard=card 


PlayerSelectCard=card 


12.3.3 ”对 保存 条 将 脾 的 列表 排 厅 


Python 语言 中 的 列表 排序 方法 有 3 个 ， 即 reverse()〈 反 转 / 倒 序 排序 )、sort()〈 正 序 排 
序 )、sorted()( 获 取 排 序 后 的 列表 )， 后 两 种 方法 还 可 以 加 入 条 件 参 数 进行 排序 。 

@@ reverse() 方 法 

将 列表 中 的 元 素 倒 序 ， 把 原 列 表 中 的 元 素 顺 序 从 右 至 左 重 新 存放 。 例 如 下 面 这 样 : 


be pe 
>>> x.reverse () 
> # 结 果 是 [4，3，2，5,，1] 


@ sort0 方 法 

此 方法 对 列表 内 容 进 行 正 回 排 序 ， 排 序 后 的 新 列表 会 履 兰 原 列 表 (ID 不 变 )， 是 就 地 
排序 ， 以 节约 空间 。 也 就 是 说 ，sort0 排 序 方法 是 直接 修改 原 列 表 。 

六 

Trl) 

> > # 结 果 是 [1， 7 

图 sorted0 方 法 

该 方法 既 可 以 保留 原 列表 ， 又 能 得 到 已 经 排 好 序 的 列表 ， 其 操作 方法 如 下 : 

人 

>>> b=sorted (a) 


> | # 结 果 是 [5， 时 > Gs he 4， 1 | 
>>> DbD # 结 果 是 [1， Fe 


注意 : 使 用 sort( 方 法 和 sorted(0) 方 法 可 以 加 入 参数 。 
列表 的 元 素 可 以 是 各 种 类 型 ， 例 如 字符 串 、 字 典 、 用 户 自 己 定义 的 类 。 如 果 不 使 用 内 
置 比 较 函 数 ， 可 以 使 用 参数 : 


sort (Cmp=None， key=None, reverse=False) 


sorted (cmp=None, key=None, reverse=False,) 


其 中 ，cmp 和 key 都 是 函数 ， 这 两 个 函数 作用 于 列表 的 元 素 上 产生 一 个 结果 ，sorted(0) 方 法 
根据 这 个 结果 来 排序 。reverse 是 一 个 布尔 值 ， 表 示 是 人 否 反 转 比较 结果 。 

cmp(el,e2) 是 市 两 个 参数 的 比较 郧 数 ， 当 返回 值 为 负数 时 el<e2， 为 0 时 el 一 e2， 为 
正 数 时 el>e2， 默 认为 None， 即 用 内 置 的 比较 函数 。 例 如 : 
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>>>students=[(" 张 海 ",20), ("李斯 "19) ,{" 赵 大 强 ", 31), ff 于 大 14) 
>>>students .sort (cmp=lambda x,y:cmp (x[1],y[1]))  # 按 年 龄 数字 大 小 排序 
>>>students 


结果 如 下 : 

了 0 

key 是 市 一 个 参数 的 图 数 ， 用 来 为 每 个 元 素 提取 比较 值 。 其 默认 为 None， 即 直接 比较 
每 个 元 素 。 通 常 ，key 比 cmp 快 很 多 ， 因 为 对 每 个 元 素 ，key 只 处 理 一 次 ， 而 cmp 会 处 
理 多 次 。 例 如 : 


>>>students=[ (' 张 海 ' ,20) , ("李斯 ',19) , (' 赵 大 强 ' ,31),，(" 王磊" ,14) ] 
>>>students.sort (key=lambda x:x[l1]) 
>>>students 


结果 如 下 : 

RE 6 
用 元 素 已 经 命名 的 属性 做 key: 

students.sort (key=lambda student: student .age) 

用 operator 函数 来 加 快速 度 ， 上 面 的 排序 等 价 于 : 


>>> from operator import itemgetter, attrgetter 
>>> students.sort (key=itemgetter (2)) 
>>> students.sort (key=attrgetter('"'age")) 


说 明 : cmp 参数 在 Python3.0 以 后 不 再 文 持 ， 所 以 Python3.5 只 能 使 用 key、reverse 


由 


在 本 章 中 需要 按 人 花色 理 牌 手 手 中 的 牌 ， 使 用 的 就 是 sort0 排 序 ， 参 数 key 使 用 的 是 麻将 
牌 的 图 像 ID 属性。 由 于 麻将 牌 的 图 像 ID 是 有 次 序 的 ， 从 而 实现 按 花 色 理 牌 。 
def sortPoker2 (cards): # 按 花色 理 牌 手 手中 的 牌 
ni=len (cards) # 元 素 〈 牌 ) 的 个 数 
cards .sort (key=operator .attrgqetter ('imagqeID') )# 按 麻将 牌 的 图 像 ID 属性 排序 
print ("排序 后 ") 


12.4 ”两 人 抹 将 游戏 设计 的 步骤 
12.4.1 设计 麻将 牌 类 


Card.as 为 及 将 有 牌 类 【继承 按钮 组 件 Button)， 构 造 函 数 根据 参数 type 
指定 肤 将 牌 的 类 型 ， 参 数 num 指定 麻将 牌 的 点 数 。 从 牌 的 类 型 和 牌 的 点 数 
计算 出 对 应 的 麻将 牌 图 片 。 麻 将 牌 的 所 有 图 片 见 图 12-2 所 示 的 素材 。 视频 讲解 
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Card 时 将 有 牌 类 可 以 实现 肤 将 牌 正 面 、 背 面 的 显示 以 及 移动 的 功能 。 


#Card 麻将 脾 类 
'''m_bFront 表示 是 否 显示 牌 正面 的 标志 
m_nType 表示 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 
m_nNum 表示 牌 的 点 数 (1 一 9) 
FrontURL 表示 牌 文件 的 URL 路 径 
imageID 表示 牌 上 自己 的 图 像 编号 ID 
cardID 表示 有 牌 日 己 在 数组 中 的 索引 ID 
x,y 表示 牌 的 坐标 
# 可 以 实现 麻将 牌 正面 、 背 面 的 显示 以 及 移动 的 功能 
class Card(Button}: 
# 构 造 函 数 ， 参 数 type 指定 牌 的 类 型 ， 参 数 num 指定 牌 的 点 数 
def init (self,cardtype,num,bm,master): 


Button. init (self,master) 


self.m nType=cardtype # 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 
self.m nNum=num # 牌 的 点 数 (1 一 9) 

# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 

if self-m nType==l : # 桶 (人 饼 ) 


FrontURL="res/nan/1" 
elif self.m nType== 2 : # 条 
FrontURL="res/nan/2" 
elif self.m nType== 3 : # 万 
FrontURL="res/nan/3" 
elif self.m nType== # 字 有 牌 
FrontURL="res/nan/4" 
self.img=bm 
self.imageID=self.m nType * 10 + self.m nNum # 牌 自己 的 图 像 编号 ID 
FrontURI FrontURbD -SETSeLEm nNMum) #URL 地 址 
FrontURL=FrontURL + ".png” 
Selfl" width"l = 51 # 麻 将 牌 方块 的 宽度 
self["height"]=67 # 有 麻将 有 牌 方块 的 高 度 
self["text"]=str (self.imageID)+".png" 
self.setrFront (False) 
#self.MoveTo(100, 100) 
self.bind("<ButtonPress>",btn MouseDown) 
self .cardID=0 


def cmp (self, other): 
return cmp(self.imageID, other.imageID) 
def setFront (self, b): # 是 否 显 示 牌 正面 
Se mbEront bh 
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TETD Tee 
self["image"]=self.img 
else: 
self["image"]=back 
def MoveTo(self, xl1, yl1): 
self .place (x=xl1], y=y1) 


第 12 章 娱乐 游戏 一 一 两 人 麻将 游戏 1 2 


# 显 示 牌 正面 图 片 


# 显示 牌 背 面 图 片 
# 移 到 指定 的 (x1，y1) 位 置 


SGTE EX # 牌 的 坐标 
self .y=yl 
def getX(self): 
return self.x 
def getyY (self): 
return self.y 
def getImageID (self): # 有 牌 自己 的 图 像 编 号 ID 
return imageID 
排 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 Card end 
、 NT ~ * 
12.4.2 ”设计 游戏 主 程序 
导入 包 及 相关 的 类 : 国 革 0 
from tkinter import * 饮 频 讲解 
import random 
from threading import Timer 
import time 
import operator 
import winsound “ # 声 音 模块 
from tkinter.messagebox import * 
创建 窗口 对 象 ，imgs 用 来 存储 麻将 图 片 。 
win=TK() # 创 建 窗口 对 象 
win.title ("两 人 麻将 一 一 夏 敏 捷 ") # 设 置 窗口 标题 
win.geometry ("995x750") 
lmgs=[] # 存 储 麻 将 的 正面 图 片 
back=PhotoImage (file='res\\bei.png')  # 存 储 牌 的 背面 图 片 
m aCards=[] # 存 储 136 张 矿 将 牌 的 列表 
PlayersCard=[[],[]] # 记 录 两 个 牌 手 拿 到 的 牌 
playersoutCcard=[[],[]] # 记 录 两 个 牌 手 出 过 的 牌 
k=0 # 记 录 已 发 出 牌 的 个 数 
m LastCard=None # 用 户 是 否 选 过 有 牌 
PlayerSelectCard=None # 用 户 选 中 的 有 牌 


MTUrcn Erues 


# 轮 到 玩家 出 牌 〈 游 戏 开 始 玩家 先 出 牌 ) 


实例 化 “号 牌 ”“ 碰 牌 ”“ 和 牌 ”“ 换 牌 ”按钮 ， 由 于 还 未 友 牌 ， 所 以 这 些 按钮 均 设 置 
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为 无 效 。 


# 功 能 按钮 

Get btn=Button (win,text=" 摸 牌 "， command=OnBtnGet Click) 
Peng btn=Button (win, text= "三 站 "， command=OnBtnChi Click) 
Chi btn=Button (win, text=" 吃 牌 "， command=OnBtnChi Click) 
Out btn=Button (win,text=" 出 牌 "， command=OnBtnOut Click) 
Win btn=Button (win,text=" 和 牌 ", width=70,height=27) 

Win btn.place (x=500,y=600,width=70, height=27) 

Chi btn.place (x=600,y=600,width=70,height=27) 

Peng btn.place (x=700,y=600,width=70,height=27) 

Out ptn.place (x=800,y=600,width=70, height=27) 

Get btn.place (x=900,y=600,width=70, height=27) 


#Get btn.pack forget () # 隐 藏 button 

#Get btn["state"]=DISABLED #“ 摸 有 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 磁 牌 ”按钮 无 效 
Chi btn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Out btn["state"]=DISABLED #“ 出 牌 ”按钮 无 效 
Win btn["state"]=DISABLED #“ 和 有 牌 ”按钮 无 效 
BeginGame () # 开 始 游戏 ， 玩 家 先 出 牌 


win.mainloop() 


BeginGame() 函 数 加 载 136 张 麻 将 牌 到 舞台 ， 同 时 重 置 游戏 ， 完 成 洗 牌 功能 ， 即 随机 交 
换 m_aCards 中 的 两 张 牌 ; 并 将 136 张 且 将 牌 的 背面 显示 在 舞台 上 ， 设 置 两 家 26 张 初始 抹 
将 牌 的 位 置 。 


def BeginGame () : # 开 始 游戏 ， 玩 家 先 出 牌 
MyTurn=True 
LOdGCarast) # 加 载 136 张 且 将 有 牌 到 有 链 台 
random.shuffle (m aCards) # 洗 有 牌 操作 ， 将 列表 中 的 元 素 打 乱 
ResetGame () # 初 始 发 26 张 牌 给 玩家 和 计算 机 
LoadCardsO 创 建 136 张 麻将 牌 ， 并 将 牌 添加 到 游戏 舞台 和 mm _aCards 列表 (数组 ) 中 。 
def LoadCards (): # 加 载 136 张 麻将 牌 到 舞台 
for m nType in range (1,4) : #1 一 3 代表 饼 、 条 、 万 
for num in range(1,10): 间 1 一 9 
# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 
if m nType==1: # 桶 (人 饼 ) 


FrontURL="res/nan/1" 
elif m nType==2 : # 条 
FrontURL="res/nan/2" 
elif m nType==3 : # 万 
FrontURL="res/nan/3" 


FrontURL=FrontURL+str (num) ”#URL 地 址 
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FrontURL=FrontURL+" .png" 

imgs.append (PhotoImage (file=FrontURL)) 

#1 一 4， 每 种 牌 4 张 

card=Card (m nType,num, imgs [len (imgs) -1],win)# 创 建 “ 饼 、 条 、 万 ”有 牌 
#card.MoveTo (100+num*60,100+m nType*80) 

# 将 牌 添加 到 列表 (数组 ) 


Forin nn rangqell Sy: 


m aCards .append (card) 


cardtype=4 # 字 有 牌 
for num in range(1,8) : #1 一 7，7 种 字 牌 
FrontURL="res/nan/4" 

FrontURL=FronNntURL+str (num) #URL 地 址 
FrontURL=FronNntURL+" .png™" 

imgs.append (PhotoImage (file=FrontURL)) 

# 每 种 牌 4 张 

card=Card (cardtype, num, imgs [len (imgs)-1],win) # 创 建 字 有 牌 
#card.MoveTo (100+num*60,100+4*80) 
#card["state"™"]=DISABLED 


m aCards .append (card) 


for n in Frange(1,5) : 


# 将 牌 添 加 到 列表 (数组 ) 


ResetGame0 在 洗 牌 操作 后 将 136 张 厂 将 脾 的 背面 显示 在 舞台 上 ， 并 完成 发 牌 功能 ， 共 
发 给 两 个 玩家 26 张 抹 将 脾 ， 同 时 设置 26 张 初 始 麻 将 牌 的 位 置 。 


def ResetGame () : # 发 给 两 家 26 张 麻 将 有 牌 
playersCard[0]=[] # 玩 家 手中 的 牌 
playersCard[1]=[] # 计 算 机 的 有 牌 
for n in range(0,1en(m aCards)): # 重 新 设置 136 有 牌 在 场景 中 的 位 置 


m aCards[n] .x=90+20* (n%34) 
m aCcards [nl -y=170+55*(n-—n%34) /34 
m aCards [nj .MoveTo (m aCaras [nj .x, m aCards [nl].y) 


#m aCards[n] .setComponentzOrder (m aCards[n], n) 


m aCards[n| .setFront (False) # 显 示 膝 将 牌 的 背面 
# 开 始 发 牌 
Shiftceardst) 
m LastCard=None # 上 次 用 户 所 选择 的 卡片 
playersoutcard[0]=[] # 玩 家 出 过 的 牌 
playersoutCcard[1]=[] # 计 算 机 出 过 的 牌 


ShiftCards() 发 给 两 个 玩家 26 张 麻 将 牌 ， 每 个 玩家 发 完 13 张 牌 以 后 ， 需 要 调用 


sortPoker2(cards) 按 花色 理 牌 手 手中 的 牌 。 


四 ESD3EEESTFOST 
global K 
for kin rangel0.206)- 
Shiftk (ky 
print ("玩家 按 花 色 理 手中 的 牌 ") 
sortPoker2 (playersCard[0]) 
print ("计算 机 按 花色 理 手 中 的 有 牌 ") 


# 发 牌 ， 设 置 最 初 发 的 26 张 麻将 牌 的 位 置 
# 玩 家 按 花 色 理 手中 的 牌 
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sortPoker2 (playersCard[1]) # 计算机 按 花 色 理 手中 的 牌 
OuterPlayerNum=0 # 出 牌 人 数 为 0 
k=26 # 发 牌 数 量 


Shift0) 设 置 最 初 26 张 啉 将 牌 的 位 置 ， 并 且 给 发 给 玩家 的 麻将 牌 加 上 "<ButtonPress>" 事 
件 监听 ， 当 单 击 麻 将 牌 时 系统 将 调用 btn MouseDown0 事 件 函数 ， 对 发 给 玩家 的 对 家 〈 计 
算 机 ) 的 抵 将 有 牌 则 不 需要 监听 。 


def Shift(k):  # 设 置 每 张 麻将 牌 的 位 置 


#global k 
print {running' ek) 
1=k%$2 
J]=(k-k%2) /2 
40 = 0 # 玩 家 自己 
m aCcardsIkls setFEront (Lrues) # 显 示 胀 将 牌 的 正面 


m aCards[k] .MoveTo (80+55*], 500) 
# 监 听 每 张 麻 将 牌 ， 当 单 击 麻将 牌 时 系统 将 调用 btn_ MouseDown () 


m aCards[k] .bind("<ButtonPress>",btn MouseDown) 


elif i=——l1 : # 玩 家 的 对 家 (计算 机 ) 
m aCards[k] .MoveTo (80+55 * J, 80) 
m aCards[k] .setFront (True) # 显 示 膝 将 牌 的 正面 


playersCard[ (ks2) ] .append (m aCards[k]) # 按 顺序 存储 到 记录 两 个 牌 手 的 牌 的 数组 


sortPoker2(cards) 按 花色 理 玩 家 手中 的 牌 。 由 于 ImageID 是 按照 花色 编号 的 ， 所 以 按照 
imageID 大 小 排序 就 可 以 了 。 


def sortPoker2 (cards): # 按 花色 理 牌 手 手 中 的 牌 
n=len (cards) 元 素 〈 牌 ) 的 个 数 
# 排 序 


cards .Sort (key=operator.attrgetter('imageID')) 
print ("排序 后 ") 
for index in range (0,n): # 重 新 设置 各 张 牌 在 场景 中 的 位 置 
print (cards [index] .imageID) 
newx=90+55*index 
y=cards [index] .getY () 
cards[index] .MoveTo (newx, y) 


ardsTindexi Cardli0 ndex 


玩家 手中 的 牌 可 以 啊 应 鼠标 单 击 ， 当 用 户 选 厅 将 牌 时 系统 将 调用 btn_MouseDown() 事 
件 函 数 。 男 外 ， 通 过 event.widget 可 以 获取 用 户 选 的 肪 将 牌 对 象 ， 将 此 牌 上 移 20 像素 。 如 
果 已 经 选 过 牌 ， 则 还 需要 将 已 经 选 过 的 牌 下 移 20 像 系 。 
# 当 用 户 选 麻将 牌 时 系统 将 自动 调用 此 函数 
def btn MouseDown (event): # 鼠标 单 击 按 下 事件 函数 
global m LastCard,PlayerSelectCard 


If event.widget["state"]==DISABLED: 
return 
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if (event .widget.m bFront==False) : 
return 
# 找 到 相应 的 麻将 有 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
Card.y-=20 
card.place (x=event .widget .x,y=event .widget.y) 
If Im pasteard— Moneks # 未 选 过 的 有 牌 
m LastCard=card 
PlayerSelectCard=card 
else: # 己 经 选 过 的 有 牌 
m LastCard.MoveTo (m LastCard.getXx(),m LastCard.getY()+20)# 下 移 20 像素 
m LastCard=card 


PlayerSelectCard=card 


以 下 是 4 个 按钮 的 单 击 事件 处 理 。 

在 “ 摸 牌 ”按钮 单 击 事件 中 ， 将 m_aCards[k] 牌 移动 到 玩家 牌 所 在 的 位 置 ， 并 按 人 花色 排 
序 理 牌 ， 调 用 ComputerCardNum(playersCard[0]) 计 算 玩 家 手中 各 种 牌 型 的 数量 并 判断 是 个 
和 牌 ， 如 果 和 牌 则 游戏 结束 。 


def OnBtnGet Click() : #“ 摸 牌 ”按钮 事件 
global K 
global playersCard,MyTurn 


# 玩 家 按 花 色 理 手中 的 牌 
macadrdsikl MoveTo(o0r el 300) 


maCcardsilkl-sethront trrue) # 显 示 有 麻将 牌 的 正面 
print ("玩家 手中 牌 1111", len (playersCard[0])) 
playersCard[0] .append (m aCards[k]) # 第 14 张 牌 

# 监 听 第 14 张 牌 

m aCards[k] .bind("<ButtonPress>",btn MouseDown) 
print ("玩家 手中 牌 2222", len (PlayersCard[0]) ) 


sortPoker2 (playersCard[0]) # 按 顺序 存储 到 记录 牌 手 的 牌 的 数组 
result1=ComputerCardNum(playersCard[0] )# 计 算 牌 手 手中 各 种 牌 型 的 数量 , 判断 是 否 和 牌 
Ul # 和 牌 了 


Win bilinl"state”"]=NORMAL 
showinfo (tit1le=" 恭 喜 ",messagqe=" 玩 家 Winlvm) 


return # 玩 家 不 需要 再 出 牌 
rl # 下 一 张 要 摸 的 牌 在 m acards 中 的 索引 号 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
chi btn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 


Merurn Tue 


在 “出 牌 ”按钮 单 击 事件 中 ， 将 被 选中 的 牌 PlayerSelectCard 移 到 左 侧 ， 并 从 
playersCard[0] 中 删除 被 选中 的 牌 PlayerSelectCard， 轮 到 计算 机 出 牌 时 ，ComputerOutO 实 
现 计 算 机 智能 出 牌 。 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


def OnBtnout CTTCKET 
global MyTurn 
global PlayerSelectCard,m LastCard,MyTurn 


print ("出 牌 ") 

if (MyTurn==False) : # 没 轮 到 自己 出 牌 
return 

if (PlayerSelectCard==None): # 还 没 选择 出 的 牌 
showinfo (title=" 提 示 ",message=" 还 没 选择 出 的 牌 ") 
return 


print (PlayerSelectCard) 

1f not (PlayerSelectCard==None): 
Out btn["state"]=DISABLED #“ 出 牌 ”按钮 无 效 
playersoutCard[0] .append (PlayerSsSelectCard); 
PlayerSelectCard.x=len (playersoutCard[0])*25-25; 间 移 动 被 选中 的 牌 
PlayerSelectCard.y=420; 
PlayerSelectCard.MoveTo (PlayerSelectCard.x, PlayerSelectCard.y); 
#outCcardorder (playersoutcard[0]); ”<# 整 理 玩家 出 的 牌 的 z 轴 深 度 
# 玩 家 牌 减少 
print (PlayerSelectCard.cardID) 
del (playersCardl0] [PlayerSelectCard.cardID]) 
#playersCard[0] .remove (PlayerSelectCard); 
m LastCard=None 
PlayerSelectCard=None 
MyTurn=False 
Out btn["state"]=DISABLED 
Computerout () # 计 算 机 智能 出 牌 
fun2 () # 游 戏 顺 序 逻 辑 控 制 


对 于 碰 、 吃 牌 ， 这 里 不 再 区 分 处 理 ， 仅 仅 将 对 家 的 牌 加 入 玩家 目 己 的 playersCard[0] 
列表 (数组 ) 中 ， 对 playersCard[0] 记 录 的 牌 进行 排序 ， 从 而 达到 理 牌 目的 。 最 后 计算 牌 手 
手中 各 种 牌 型 的 数量 ， 判 断 是 否 和 牌 ， 如 果 和 牌 则 “出 牌 ” 按 钮 无 效 ， 人 否则 “出 牌 ” 按 钮 
出 现 ， 玩 家 选择 牌 后 可 以 出 牌 。 

# 对 于 磁 、 吃 牌 ， 这 里 不 再 区 分 处 理 


def OnBtnChi Click() : #“ 吃 牌 ”按钮 单 击 事件 


global MyTurn 
card=playersOoutCardl[l] [len (playersoutCard[1])-1]; 
card.MoveTo (90+55*13, 500); 


card.setFront (True) ; # 显 示 麻 将 牌 的 正面 
playersCardl0] .append (card); # 第 14 张 牌 
# 监 听 第 14 张 牌 


#card.bind ("<ButtonPress>",btn MouseDown) ”<# 不 绑 定 事件 ， 可 以 防止 此 牌 被 玩家 再 次 出 
print (" 碰 吃 的 牌 是 ",card.imageID) 

sortPoker2 (playersCard[0]); # 按 顺序 存储 到 记录 玩家 的 牌 的 列表 (数组 中 
result1=ComputerCardNum (playersCard[0]);# 计 算 牌 手 手 中 各 种 牌 型 的 数量 ， 判 断 是 否 和 上牌 
下 # 和 有 牌 了 
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Win btn["state"]=NORMAL 
Out btn["state"]=DISABLED  #“ 出 牌 ”按钮 无 效 
showinfo (tit1le=" 恭 喜 ",messagqe=" 玩 家 Winlvm) 


return # 玩 家 不 需要 再 出 牌 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 
Chi btni"state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 磁 牌 ” 按 钮 无 效 


MyTurn=True 


fun2(0) 实 现 游戏 过 程 中 出 牌 顺序 的 控制 逻辑 。 在 游戏 中 有 两 个 牌 手 ， 一 个 是 玩家 目 己 
(0 号 牌 手 )， 一 个 是 计算 机 《1 号 牌 手 )。 在 玩家 出 牌 后 系统 目 动 调用 ComputerOutO 实 现 计 
算 机 智能 出 牌 ， 这 时 又 轮 到 玩家 出 牌 ， 需 要 判断 计算 机 出 的 牌 玩 家 是 人 否 可 以 吃 、 磁 ， 如 果 
可 以 ， 则 “号 牌 ”“ 碰 牌 ”按钮 有 效 。 


GE En 人- # 出 牌 顺序 控制 
MyTurn=True # 轮 到 玩家 出 牌 
Get btn [mstatem]=NORMRAL #“ 摸 牌 ”按钮 有 效 


if (len (playersoutCcard[1])>0): 
# 取 计算 机 出 的 牌 ， 即 最 后 一 张 
card=playersOoutCard[l1] [len (playersoutCard[l]l1])-1] 
# 判 断 计算 机 出 的 牌 玩家 是 否 可 以 吃 、 磁 
if(canPeng (playersCard[0],card)): <# 玩 家 是 否 可 以 碰 牌 


Peng btn["state"]=NORMAL #“ 碰 牌 ”按钮 有 效 
if (canchi (plaverscard[0],card))，“”# 所 家 是 省 可 以 临 牌 
Chi btn["state"]=NORMAL #“ 吃 牌 ”按钮 有 效 


# 不 能 吃 、 碰 则 只 能 直接 摸 牌 

if ( not canChi (playersCard[0],card)and not canPeng (playersCard[0],card)): 
Peng btn["state"]=DISABLED 
en ntni" stateni=DISABEED 


#0nBtnGet Click(); # 直 接 摸 牌 
else: # 计 算 机 没 出 过 牌 直接 摸 牌 
Get btn["state"]=NORMRL #“ 措 牌 ”按钮 有 效 


为 了 实现 在 不 能 吃 、 碰 的 情况 下 目 动 摸 牧 ,不 需要 等 玩家 单 击 “ 摸 和 脾 ” 按 钮 后 才 摸 有 牌 ， 
可 以 将 上 面 的 “直接 摸 脾 ” 行 的 注释 取消 挥 ， 这 样 就 可 以 减少 让 玩家 摸 脾 的 抹 烦 ,但 是 如 
果 可 以 选择 吃 、 磅 ， 这 时 还 是 可 以 让 玩家 单 击 “ 摸 牌 ”按钮 的 ， 因 为 玩家 可 以 放弃 吃 、 磁 。 

ComputerOut(Order:inb 实现 计算 机 智能 出 牌 ， 首 先 将 m aCards[k] 牌 移动 到 对 家 
(计算 机 ) 牌 所 在 的 位 置 ， 并 按 花 色 排 序 理 牌 。 调 用 ComputerCardNum(playersCard[0]) 计 
算 牌 手 手 中 各 种 牌 型 的 数量 并 判断 是 否 和 牌 ， 如 果 和 牌 则 游戏 结束 ， 人 否则 调用 
ComputerCard (playersCard[1]) 知 能 出 牌 。 


def Computerout () : # 计 算 机 智能 出 牌 
global k,MyTurn 
# 对 家 《〈 计 算 机 ) 摸 牌 
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P 项 目 案 例 开 发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


mT qcCardsIiki MoveTolsS0 ral 20)s 

m aCards[k] .setFront (True); # 显 示 膝 将 牌 正面 

playersCard[1] .append (m aCards[k]); # 第 14 张 牌 

result1=ComputerCardNum (playersCard[1]);# 计 算计 算 机 的 各 种 牌 型 的 数量 ， 判 断 是 否 和 上牌 


和] # 和 有 牌 了 

showinfo (title=" 遗 憾 ",message=" 计 算 机 Win!") 

return; # 对 家 (计算 机 ) 不 需要 再 出 牌 
1=ComputerCard (playersCard[1]); # 知 能 出 牌 
41 0 # 总 是 出 第 1 张 牌 ， 没 有 智能 出 牌 


card=playersCard[1] [1] 

del (playersCard[1] [i]) 

# 加 到 计算 机 出 过 牌 的 数组 

playersoutCard[1] .append (card) 

#outCardorder (playersoutcard[1]);  # 整 理 出 过 的 牌 ，Zz 轴 深 度 问 题 


card.setFront (True) ; # 显 示 有 麻将 牌 正面 
playSound (card) # 根 据 计 算 机 出 牌 选择 声音 文件 播放 
# 计算机 按 花 色 理 手中 的 牌 


sortPoker2 (PLayersCard[1]) ; 
card.x=len (playersOutCard[1])*25-—25; 


card.y=10; 

card.MoveTo(card.x, Card- vy}? 

k=k+1 # 发 过 牌 的 总 数 
MyTurn=True # 轮 到 玩家 


playSound(card) 实 现 播放 牌 对 应 的 声音 文件 。 


def playSound (Card) : 

#music="res/sound/ 二 条 .wav"; 

# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 

music="res/sound/"+toChineseNumstring (card.m nNum); 

if card.m nType==1: # 桶 (人 饼 ) 
music+="” 柄 .wav ; 

elif card.m nType==2: # 条 
music+=" 条 .wav"; 

elif card.m nType==3: # 万 
music+=" 万 .wav"; 

elif card.m nType==4: # 字 有 牌 
music="res/sound/give.wav"; 


winsound.PlaySound (music, winsound.SsND FILENAME) 


由 于 声音 文件 名 是 汉字 ， 例 如 “一 万 mp3”“ 二 万 mp32”， 所 以 在 计算 机 出 牌 时 
toChineseNumString(n:int) 将 牌 面 的 数字 转换 成 汉字 。 


def toChineseNumSstring (n): 
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if n==1: 
music="—" 
elif n==2: 
music=" 二 " 
elif n==3: 
msic=" on 
elif n==4: 
music=" 出 " 
elif n==5: 


music=" 五 " 


DI 
elif n==7: 
music=" 七 " 
elif n==8: 
msTtes=m 
elif n==9: 
SITE 


return music 


在 和 牌 算法 中 需要 计算 每 种 花色 厅 将 牌 的 数量 以 及 每 种 牌 型 的 数量 ， 
ComputerCardNum(cards) 根 据 cards 计算 出 数据 按 和 牌 的 数据 结构 存 入 paiArray 中 , 调用 和 
牌 算法 类 中 的 Win(paiArray) 判 断 是 否 和 有 牌 。 


def ComputerCardNum (cards): # 玩 家 手中 的 牌 
# 计 算 牌 手 手 中 各 种 牌 型 的 数量 
paiArrav=[[0,.0,0.0,.050.050;0,.0]， 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0]1] 
print ("玩家 手中 的 牌 ", len (cards)) 
for 1 in range(0,14): 
cdrd endsin 
if (card.imageID>10 and card.imageID<20): # 饼 
paiArray[0] [0]1+=1 
paiArray[0] [card.imageID-10]+=1 
if (card.imageID>20 and card.imageID<30): # 条 
paiArray[1] [0]+=1 
paiArrayl[l1] [card.imageID-20]+=1 
if (card.imageID>30 and card.imageID<40): # 万 
paiArray[2] [0]1+=1 
paiArray[2] [card.imageID-30]+=1 
1a (card maelD Ad and Card msgeBc501= # 字 
paiArray[3] [0]1+=1 
paiArray[3] [card.imageID-40]+=1 
print (paiArray) 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 
hu=huMain () # 和 有 牌 算法 类 
result=hu.Win (paiArray) # 判 断 是 否 和 牌 
return result 


本 两 傈 将 游戏 还 有 许多 地 方 需要 完善 , 例如 人 磁 、 吃 脾 功 能 ， 需 要 记录 哪 几 张 有 牌 “ 吃 ” 
和 “ 磁 ” 这 几 张 牌 不 能 再 出 , 可 以 通过 在 Card 类 里 增加 Selected 属性 来 记录 是 否 用 于 “ 吃 ” 
和 “ 碰 ”, 这样 玩 家 选择 出 牌 时 判断 Selected 属性 的 真 假 就 可 以 知道 是 否 能 出 。 另 外 还 有 “ 杠 ?” 


图 12-3 两 人 麻将 游戏 的 运行 界面 
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本 章 基 于 TCP 完成 一 个 在 线 聊天 程序 ， 主 要 功能 是 实现 客户 端 与 服务 器 端的 双 回 通 
信 ， 运 行 效果 如 图 13-1 所 示 。 


容 户 站 2016-08-D2 09:06:21 说 : 
服务 下 2016-08-02 09:06:37 说 : 
很 好 ， 


图 13-1 在 线 聊 天 的 服务 器 端 与 客户 端 


13.2 关键 技术 
13.2.1 互联 网 TCP/IP 协议 


计算 机 为 了 连 网 ， 必 须 规定 通信 协议 ， 早 期 的 计算 机 网 络 都 是 由 各 厂商 自己 规定 一 套 


和 时 T 本 于 是 一 二胡 ， 机 本 全 和 改 吕 
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端口 。 

端口 有 什么 作用 ? 在 两 台 计 算 机 通信 时 只 发 IP 地 址 是 不 够 的 , 因为 同一 台 计 算 机 上 运 
行 着 多 个 网 络 程序 (例如 浏览 器 、QEQ 等 网 络 程序 )。 在 一 个 IP 包 来 了 之 后 ， 到 底 是 交 给 
浏览 器 还 是 QQ， 和 需要 端口 号 来 区 分 。 每 个 网 络 程序 都 问 操 作 系统 申请 唯一 的 端口 号 ， 这 
样 两 个 进程 在 两 台 计 算 机 之 间 建 立 网 络 连 接 就 需要 各 目的 了 P 地 址 和 各 目的 端口 号 。 例 如 浏 
贤 器 经 常 使 用 80 端口 ，FTP 程序 使 用 21 端口 ， 邮 件 的 收 / 发 使 用 25 端口 。 

网 络 上 两 台 计 算 机 之 间 的 数据 通信 ， 归 根 结 底 就 是 不 同 主机 的 进程 交互 ， 而 每 个 主机 
的 进程 又 对 应 着 某 个 端口 。 也 就 是 说 ， 单 独 靠 IP 地 址 是 无 法 完成 通信 的 ， 必 须要 有 IP 和 
端口 。 


13.2.3 TCP 协议 和 UDP 协议 


TCP 协议 建立 在 人 PP 协议 之 上 。TCP 协议 负责 在 两 台 计 算 机 之 间 建 立 可 靠 连接 ， 保 证 
数据 包 按 顺序 到 达 。TCP 协议 会 通过 握手 建立 连接 , 然后 对 每 个 他 包 编 号 ， 确 保 对 方 按 顺 
序 收 到 ， 如 果 包 丢掉 了 ， 就 自动 重 发 。 

许多 常用 的 更 高 级 的 协议 都 是 建立 在 TCP 协议 基础 上 的 , 例如 用 于 浏览 器 的 HTTP 协 
议 、 发 送 邮件 的 SMTP 协议 等 。 

UDP 协议 同样 建立 在 IP 协议 之 上 ,但 是 UDP 协议 面 回 无 连接 的 通信 协议 ， 不 保证 数 
据 包 的 顺利 到 达 ， 是 不 可 靠 传 输 ， 所 以 效率 比 TCP 要 高 。 


13.2.4 Socket 


Socket 是 网 络 编程 的 一 个 抽象 概念 。Socket 是 套 接 字 的 英文 名 称 ， 主 要 是 用 于 网 络 通 
信 编 程 。 在 20 世纪 80 年 代 初 ， 美 国政 府 的 高 级 研究 工程 机 构 (ARPA) 给 加 利 福 尼 亚 大 
学 的 Berkeley 分 校 提 供 了 资金 ， 让 他 们 在 UNIX 操作 系统 下 实现 TCP/PP 协议 。 在 这 个 项 
目 中 ， ne TCP/IP 网 络 通信 开发 了 一 个 API( 应 用 程序 接口 ), 这 个 API 称 为 Socket 
( 套 接 字 )。Socket 是 TCP/IP 网 络 最 为 通用 的 API， 任 何 网 络 通信 都 是 通过 Socket 来 完 
成 的 。 

通常 用 一 个 Socket 表示 “打开 了 一 个 网 络 链接 ”， 而 打开 一 个 Socket 需要 知道 目标 计 
算 机 的 他 地 址 和 端口 号 ， 再 指定 协议 类 型 。 

套 接 字 构造 函数 socket(family.type[.protocol]) 使 用 给 定 的 套 接 字 家 族 、 套 接 字 类 型 、 协 
议 编号 来 创建 套 接 字 。 

其 参数 如 下 。 

。 family: 套 接 字 家 族 ， 可 以 是 AF UNIX 或 者 AF INET、AF INET6。 

。 type: 套 接 字 类 型 ， 可 以 根据 是 面向 连接 的 还 是 非 连接 的 分 为 SOCK _ STREAM 和 

SOCK DORAM 。 
e protocol: 一 般 不 填 ， 默 认为 0。 
参数 的 取 值 的 含义 见 表 13-1。 
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表 13-1 参数 的 取 值 含义 


参 数 描 述 
socket.AF_ UNIX 只 能 够 用 于 单一 的 Unix 系统 进程 间 通 信 
socket.AF INET 服务 器 之 间 的 网 络 通 信 
socket.AF INET6 IPv6 
socket.SOCK STREAM 流 式 Socket， 和 针对 TCP 
socket.SOCK DGRAM 数据 报 式 Socket， 针 对 UDP 


原始 套 接 字 ， 首 先 ， 普通 的 套 接 字 无 法 处 理 ICMP、IGMP 等 网 络 
报 文 ， 而 SOCK_RAW 可 以 ; 其 次 ，SOCK RAW 也 可 以 处 理 特 
殊 的 IPv4 报 文 ; 此 外 ,利用 原始 套 接 字 ， 可 以 通过 IP_HDRINCL 
套 接 字 选项 由 用 户 构造 卫 头 

socket.SOCK SEQPACKET 可 靠 的 连续 数据 包 服 务 


例如 创建 TCP Socket: 


SS0OCket SocKet (SOCKeE=APF INPT SOCKeL SOCK STREAM) 


socket.SOCK RAW 


创建 UDP Socket: 
SOCMeE OEElSoC er A iN OEE SO DRA 


Socket 同时 支持 数据 流 Socket 和 数据 报 Socket。 图 13-3 是 面向 连接 支持 数据 流 TCP 
的 时 序 图 。 


服务 如 


Socket() 


客户 机 


Socket() 


阳 赛 ， 等 待 客户 数据 建立 连接 


Accept() 


服务 器 处 理 请 求 


应 党 数据 


图 13-3 面 回 连接 TCP 的 时 序 图 
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由 该 图 可 以 看 出 ， 客 户 机 (Client) 与 服务 器 (Server) 的 关系 是 不 对 称 的 。 

对 于 TCP C/S， 服 务 器 首先 局 动 ， 然 后 在 某 一 时 刻 局 动 客户 机 与 服务 器 建立 连接 。 服 
务 器 与 客户 机 开始 都 必须 调用 Socket0 建 立 一 个 套 接 字 ， 然 后 服务 器 调用 Bind0 将 套 接 字 
与 一 个 本 机 指定 端口 绑 定 在 一 起 ， 再 调用 Listen0 使 套 接 字 处 于 一 种 被 动 的 准备 接收 状态 ， 
这 时 客户 机 建立 套 接 字 便 可 以 通过 调用 Connect0 和 服务 器 建立 连接 ， 服 务 器 就 可 以 调用 
Accept(0 来 接收 客户 机 连接 。 然 后 继续 监听 指定 端口 ， 并 发 出 阻塞 ， 直 到 下 一 个 请 求 出 现 ， 
从 而 实现 多 个 客户 机 连接 。 在 连接 建立 之 后 ， 客 户 机 和 服务 器 之 间 就 可 以 通过 连接 发 送 和 
接收 数据 。 最 后 ， 答 数据 传送 结束 ， 双 方 调用 Close0 关 闭 套 接 字 。 

在 Python 的 Socket 模块 中 Socket 对 象 提 供 的 函数 如 表 13-2 所 示 。 


表 13-2 ”Socket 对 象 的 函数 


绑 定 地 址 (hostbport) 到 套 接 字 ， 在 AF_INET 下 以 元 组 (hostport) 的 形式 
s.bind(host,port) 表示 地 址 
mm 开始 TCP 监听 。 backlog 指定 在 拒绝 连接 之 前 可 以 的 最 大 连接 数量 。 该 值 至 
少 为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 
s.acceptO) 被 动 接受 TCP 客户 端 连接 , (阻塞 式 ) 等 待 连接 的 到 来 
客户 端 套 接 字 函数 


主动 与 TCP 服务 器 连接 。 一 般 address 的 格式 为 元 组 (hostname,port)， 如 
果 连 接 出 错 ， 返 回 socket.error 错误 
connect() 函 数 的 扩展 版 本 ， 出 错时 返回 出 错 码 ， 而 不 是 抛 出 异常 


s.connect(address) 


s.connect ex() 


公共 用 途 的 套 接 字 函数 
/ 接收 TCP 数据 , 数据 以 字 节 串 形式 返回 。bufsize 指定 要 接收 的 最 大 数据 量 。 
Te 7e 8 ) | gag 提供 有 关 消息 的 其 他 信息 ， 通 常 可 以 忽略 
发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 。 其 返回 值 是 要 发 送 
ee 的 字 节 数量 ， 该 数量 可 能 小 于 data 的 字 节 大 小 
完整 发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 ， 但 在 返回 之 前 
s.sendall(data) 


会 尝试 发 送 所 有 数据 。 如 果 成 功 ， 返 回 None， 如 果 失 败 ， 抛 出 异常 

接收 UDP 数据 ， 与 recv0 类 似 ， 但 返回 值 是 (data,address )。 其 中 ，data 是 
包含 接收 数据 的 字 节 串 ，address 是 发 送 数据 的 套 接 字 地 址 

发 送 UDP 数据 ， 将 数据 发 送 到 套 接 字 ，address 是 形式 为 (ip,port) 的 元 组 ， 


s.recvform(bufsize,|,flag]) 


s.sendto(data,address) 


s.close() 
s.getpeername() 
s.getsockname() 
s.setsockopt(level, 
optname,value) 
s.getsockopt(level, 
optname) 


s.settimeout(timeout) 


s.gettimeout() 
s.fileno() 


指定 远程 地 址 。 其 返回 值 是 发 送 的 字 节 数 

关闭 套 接 字 

返回 连接 套 接 字 的 远程 地 址 ， 其 返回 值 通常 是 元 组 (ipaddr,port) 
返回 套 接 字 上 自己 的 地 址 ， 通 常 是 一 个 元 组 〈ipaddrport) 

设置 给 定 套 接 字 选项 的 值 

返回 套 接 字 选项 的 值 

设置 套 接 字 操作 的 超时 时 间 , timeout 是 一 个 浮 点 数 , 单位 是 秒 。 其 值 为 None 
表示 没有 超时 时 间 。 一 般 情 况 下 ， 超 时 时 间 应 该 在 刚 创 建 套 接 字 时 设置 ， 
因为 它们 可 能 用 于 连接 操作 (例如 connectO ) 

返回 当前 超时 时 间 的 值 ， 单 位 是 秒 ， 如 果 没 有 设置 超时 期 ， 则 返回 None 
返回 套 接 字 的 文件 描述 符 
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续 表 
如 果 flag 为 0, 则 将 套 接 字 设 为 非 阻塞 模式 , 否则 将 套 接 字 设 为 阻塞 模式 ( 默 
s.setblocking(flag) 认 值 )。 在 非 阻塞 模式 下 ， 如 果 调 用 recvO 没 有 发 现任 何 数据 ， 或 sendO 调 用 
无 法 立即 发 送 数据 ， 那 么 将 引起 socket.error 异常 
s.makefile() 创建 一 个 与 该 套 接 字 相 关联 的 文件 


在 了 解 了 TCP/IP 协议 的 基本 概念 以 及 IP 地址、 端口 的 概念 和 Socket 之 后 ， 就 可 以 开 
始 进行 网 络 编程 了 。 

[ 例 ]13-1 编写 一 个 简单 的 TCP 服务 器 程序 ， 它 接收 客户 疹 连 接 ， 把 客户 端 发 过 来 的 
字符 串 加 上 "Hello" 再 发 回去 。 

完整 的 TCP 服务 硕 闯 程序 如 下 : 

import socket # 导 入 socket 模块 

import threading # 导 入 threading 线程 模块 


def tcplink (sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 ' $$ addr) 


sock.send(b'Welcome!') # 发 给 客户 端 Welcome! 信 息 
while True: 
data=sock.recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
It not dat3 Or data ecoda("utt 8) "exit # 如 果 没 数据 或 收 到 “exit” 信 息 
break # 终 止 循环 
sock.send(('Hello, %s!"' %$% data.decode("'utf-8')) .encode('"'utf-8"')) 
# 收 到 信息 加 上 Hello 发 回 
sock.close() # 关 闭 连 接 


print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 
Ss=socket .socket (socket .AF INET, socket.SOCK STREAM) 
s.bind(('127.0.0.1', 8888)) # 监 听 本 机 8888 端口 
s.listen(5) # 连 接 的 最 大 数量 为 5 
print (' 等 待 客户 端 连接 . . .') 


,古人 


sock, addr=s.accept () # 接 受 一 个 新 连接 
# 创 建新 线程 来 处 理 TCP 连接 

t=threading.Thread (target=tcplink, args=(sock, addr)) 
医生 号 上 上 中 下 


在 程序 中 首先 创建 一 个 基于 IPv4 和 TCP 协议 的 Socket: 

S30GEeGISOGKeElSoOCkeG MP TINET TOGKee SO STREAM) 

然后 绑 定 监听 的 地 址 和 端口 。 服 务 器 可 能 有 多 块 网 卡 ， 可 以 绑 定 到 茶 一 块 网 卡 的 IP 
地 址 上， 也 可 以 用 0.0.0.0 绑 定 到 所 有 的 网 络 地 址 ， 还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。 
127.0.0.1 是 一 个 特殊 的 卫 地 址 ， 表 示 本 机 地 址 ， 如 果 绑 定 到 这 个 地 址 ， 客 户 端 必须 同时 在 
本 机 运行 才能 连接 ， 也 就 是 说 ， 外 部 的 计算 机 无 法 连接 进来 。 

疹 口 号 需要 预先 指定 。 因 为 这 里 写 的 这 个 服务 不 是 标准 服务 ， 所 以 用 8888 这 个 端口 
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号 。 注 意 ， 小 于 1024 的 端口 写 必 须要 有 管理 员 权 限 才 能 绑 定 。 


# 监 听 本 机 8888 端口 
SDIndtl" 171 0 0 SI 


接 看 调用 listen0 方 法 开始 监听 端口 ， 传 入 的 参数 指定 等 行 连接 的 最 大 数量 为 5: 


se Tistents) 
print (' 等 待 客户 端 连接 . ..') 


接 下 来 ， 服务器 程序 通过 一 个 无 限 循 环 接受 来 自 客 户 端的 连接 ，accept( 会 等 等 并 返回 
一 个 客户 端的 连接 。 
while True : 
# 接 受 一 个 新 连接 
sock，addr=s.accept ()#sock 是 新 建 的 Socket 对 象 ， 服 务 器 通过 它 与 对 应 客户 端 通 
# 信 ，aqdr 是 IP 地 址 


# 创 建新 线程 来 处 理 TCP 连接 
t=threading.Thread (target=tcplink, args=(sock, addr)) 


gEareErt) 
每 个 连接 都 必须 创建 新 线程 〈 或 进程 ) 来 处 理 ， 人 否则 单线 程 在 处 理 连接 的 过 程 中 无 法 
接受 其 他 客户 疹 的 连接 : 


def tcplink(sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 ' gs addr) 


sock.send(b'Welcome!') # 发 给 客户 端 “Welcome! ”信息 
while True: 
data=sock.recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
if not data or data.decode ('utf-8') 二 'exit" :# 如 果 没 数据 或 收 到 'exjit 信息 
break # 终 止 循环 


sock.send(('Hello, %s!" $% data.decode('utf-8')) .encode("'utf-8°"')) 
# 收 到 信息 加 上 “He1l1o” 发 回 
sock.close() # 关 闭 连 接 
print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 


在 连接 建立 后 ， 服 务 器 首先 发 一 条 欢迎 消 轧 ， 然 后 等 待 客户 端 数 据 ， 并 加 上 “Hello” 
再 发 送 给 客户 端 。 如 果 客 户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 
如 果 要 测试 这 个 服务 器 程序 ， 还 需要 编写 一 个 客户 端 程序 : 


import socket # 导 入 socket 模块 
Ss=socket .socket (socket .AF INET, socket.SOCK STREAM) 
SCONnmecEllt 12 0501 “8888}3 # 建 立 连 接 

# 打 印 接收 到 欢迎 消息 


print (s.recv(1024) .decode ('utf-8') ) 

for data In lb Mchael DTracy bgarah”l: 
s.send (data) # 客 户 端 程序 发 送 人 名 数据 给 服务 器 端 
print (s.recv(1024) .decode ('utf-8°"')) 
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SS Send(b exit")} 


Ss.close() 


打开 两 个 命令 行 窗 口 ， 一 个 是 运行 服务 器 端 程序 ， 另 一 个 是 运行 客户 端 程序 ， 就 可 以 
看 到 运行 效果 ， 如 图 13-4 和 图 13-5 所 示 。 


CNWindows\py.exe 


各 户 角 过 接 
专 收 一 个 来 目 12774 B.B.1: 4759 注 接 请 来 
来 自 127.0.0.1:4758 ] 主 榜 天 | 局 


图 13-4 ”服务 口 程序 效果 


mi C\Windows\py.exe 


- Michael19 


»- Tracut 


» Saraht 


图 13-5 客户 端 程序 效果 


需要 注意 的 是 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 
按 Ctrl+C 组 合 键 退 出 程序 。 

可 见 ， 用 TCP 协议 进行 Socket 编程 在 Python 中 十 分 简单 ， 对 于 客 尸 端 ， 要 主动 连接 
服务 器 的 IP 和 指定 端口 ， 对 于 服务 器 ， 要 首先 监听 指定 端口 ， 然 后 对 每 一 个 新 的 连接 创建 
一 个 线程 或 进程 来 处 理 。 通 常 ， 服 务 器 程序 会 无 限 运 行 下 去 。 另 外 还 需 注 意 ， 同 一 个 端口 
被 一 个 Socket 绑 定 了 以 后 就 不 能 被 其 他 Socket 绑 定 了 。 


13.2.5 ”多 线程 编程 


线程 是 操作 系统 可 以 调度 的 最 小 执行 单位 ， 能 够 执行 并 发 处 理 。 通 常 是 将 程序 拆 分 成 
I it 即 同时 执行 多 个 操作 。 例 如 ， 在 使 用 线程 的 同时 监视 用 户 并 
友 输 入 ， 并 执行 后 台 任 务 

lie et 类 来 创建 和 处 理 线程 ， 格 式 如 下 : 

线程 对 象 =threading.Thread(target= 线 程 函数 ,args=( 参 数列 表 )，name= 线 程 名 ， 

group= 线 程 组 ) 

第 一 个 参数 是 函数 名 ， 第 二 个 参数 args 是 一 个 元 组 ， 线 程 名 和 线程 组 都 可 以 省 略 . 

Thread 类 还 提供 了 以 下 方法 。 
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。 run(): 用 于 表示 线程 活动 的 方法 。 

e start(): 局 动 线程 活动 。 

。 join([time]): 可 以 阻 寨 进程 ， 直 到 线程 执行 完毕 。 参 数 time 指定 超时 时 间 (单位 为 
秒 )， 超 过 指定 时 间 join 就 不 再 阻塞 进程 了 。 

。 isAlive0: 人 返回 线程 是 否 活动 。 

。 getName(): 返回 线程 名 。 

。 setName(): 设置 线程 名 。 

threading 模块 提供 的 其 他 方法 如 下 : 

。 threading.currentThread0: 返回 当前 的 线程 变量 。 

e threading.enumerate(): 返回 一 个 包含 正在 运行 的 线程 的 lst。 正 在 运行 指 线程 司 动 
后 、 绪 束 前 ， 不 包括 启动 前 和 终止 后 的 线程 。 

。 threading.activeCount(): 返回 正在 运行 的 线程 数量 , 与 len(threading.enumerate()) 有 相 
同 的 结果 。 

[ 例 ]13-2 编写 自己 的 线程 类 myThread 来 创建 线程 对 象 。 

分 析 : 目 己 的 线程 类 直接 从 threading.Thread 类 继承 ， 然 后 重 写 。_init 0 方法 和 run() 


方法 就 可 以 创建 线程 对 象 了 。 


import threading 
import time 
exitFlag=0 
class myThread (threading.Thread) : “ 间 继 承 父 类 threading.Thread 
def init (self, threadID, name, counter): 
threading.Thread. init (self) 
self.threadID=threadID 
self .name=name 
self .counter=counter 
def run (self) :# 把 要 执行 的 代码 写 到 run () 函数 里 面 ， 线 程 在 创建 后 会 直接 运行 run () 函数 
print ("starting "+self.name) 
print time (self.name, self.counter, 5) 
print ("Exiting "+self.name) 
def print time (threadName, delay, counter): 
while counter: 
1if exitFlag: 
Eee 
time.sleep (delay) 
print ("$s: Ss"% (threadName, time.ctime (time.time()))) 
counter—=]1 
# 创 建新 线程 
threadl=myThread (1, "Thread-—1™", 1) 
thread2=myThread (2, "Thread-—2", 2) 
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开局 线程 


threadl .start () 
thread2 . Start () 
print ("Exiting Main Thread") 


以 上 程序 的 执行 结果 如 下 ; 


Starting Thread-l 


Thread-1: 
Thread-2 : 
Thread—1: 
Thread-1: 
Thread-2: 
Thread-—1: 
Thread-—1: 


Tue 
[二 
Tue 
Tue 
Tue 
Te 


Tue 


Aug 
Aug 
Aug 
Aug 
Aug 
Aug 
Aug 


Exiting Thread-1 
Thread-2: Tue Aug 
Thread-2: Tue Aug 
Thread-2: Tue Aug 
Exiting Thread-2 


在 线 聊 天 程序 的 服务 怖 站 


在 服务 器 问 设 


13.3.1 


sendMessage(self), 


Exit1ng 
Zs 
ee 
Ls 
下 和 
a 
Ls 
和 


[CI 


[5 


下 和 
7 和 
< 有 和 


#Filename:ServerUI.py 


#Python 在 线 聊天 服务 器 端 


import tkinter 


import tkinter.font as tkFont 


import socket 


import threading 


import time,tsys 


class ServerUI(): 


local= 127 020- 0 


port=5505 


global serverSock; 
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Te 
pe 
ee 
于 有 > 
二 
Us 
Es 


有 
有 
有 


Main Thread Starting Thread-2 


2016 
2016 
2 
201L.6 
2016 
<2016 
2016 


2016 
2016 
之 好 于 站 


计 ServerUI 类 ， 封 状 接 收 消 奶 函数 方法 receiveMessage(selfj、 发 送 消 旦 
并 在 构造 函数 中 完成 Tkinter 界面 布局 。 

人 在 服务 右 端 建立 Socket 并 绑 定 5505 后 循环 接受 客户 端的 连接 请 求 。 当 服务 器 与 客 刻 
病 的 连接 建 并 后 ， 如 果 客 户 问 发 送 字 符 Y， 服 务 器 病 收 到 后 会 返回 字符 Y 信息 ， 表 明 连 接 
建立 成功。 在 连接 建立 成 功 后 即 可 不 断 接收 客 尸 端 友 来 的 聊天 信息 。 

下 面 是 服务 器 病人 代码 : 
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flag=False 
# 初 始 化 类 的 相关 属性 的 构造 函数 
def init (self): 


self.root=tkinter.Tk () 

self.root.title('Python 在 线 聊 天 -服务 器 端 V1 .01') 

# 窗 口 面板 ， 用 4 个 frame 面板 布局 
self.frame=[tkinter.Frame(),tkinter.Frame () ,tklnter-Frame() ， 
tkinter Framel}l 

# 显 示 消 息 Text 右边 的 滚动 条 

SETE chatTextScrollBar— tkinter: ScrolibarlseLlf framel0i) 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fi1l=tkinter.Y) 
# 显 示 消 息 Text， 并 绑 定 上 面 的 滚动 条 

ft= 七 KFont .Font (family="'Fixdsys"',size=11) 
self.chatText=tkinter.Listbox(self.frame[0],width=70,height=18, 
font=ft) 
self.chatText["'yscrollcommand"]=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fil1l=tkinter .BOTH) 
self.chatTextScrollBar['command']=self.chatText.yview() 
self.frame[0] .pack (expand=1, fil1l=tkinter .BOTH) 

# 标 签 ， 分 开 消 息 显 示 Text 和 消息 输入 Text 

label=tkinter.Label (self.frame[l1],height=2) 

label .pack (fill=tkinter .BOTH) 
self.frame[l1] .pack (expand=1, fil1l=tkinter .BOTH) 

# 输 入 消息 Text 的 滚动 条 

self.inputTextScrollBar=tkinter.Scrollbar (self.frame[2]) 
self.inputTextScrollBar.pack (side=tkinter.RIGHT, fil1l=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 

ft= 七 KFont .Font (family="'Fixdsys',s1ze=11) 
self.inputText=tkinter.Text (self.frame[2],width=70,height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=1, fil1l=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview () 
self.frame[2] .pack (expand=1, fil1l=tkinter .BOTH) 

#“ 发 送 ”按钮 
self.sendButton=tkinter.Button (self.frame [3] ,text=' 发送" width=10 ， 
command=self .sendMessage,) 
self.sendButton.pack (expand=1, side=tkinter.BOTTOM and tkinter 

- RIGHT, padx=25, pady=>) 

#“ 大 闭 ” 按 钮 

self.closeButton=tkinter .Button (self .frame[3],text=' 关 闭 ' ,width=10, command 
=self.close) 

self.closeButton.pack (expand=1,side=tkinter.RIGHT,padx=25,pady=5) 
self.frame[3] .pack (expand=1, fil1l=tkinter .BOTH) 
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# 接 收 消息 
def receiveMessage (self): 
# 建 立 Socket 连接 
self.serverSock=socket .socket (socket .AF INET,socket.SOCK STREAM) 
self.serverSock.bind( (self.]local, self .port)) 
self Serversock Iastentl5) 
self .buffer=1024 
self.chatText.insert (tkinter-END,，' 服 务 器 已 经 就 绪 . . . . . . ') 
# 循 环 接受 客户 端的 连接 请 求 
while True: 
self.connection,self.address=self.serverSock.accept () 
self .flag=True 
while True: 
# 接 收 客户 端 发 送 的 消息 
self.cientMsg=self.connection.recv (self.buffer) .decode ('"utf-8' ) 
if not self.cientMsg: 
continue 
elif self.cientMsg=="'Y'": 
self .chatText .insert (tkinter .END, ' 服务器 端 已 经 与 客户 端 建立 


selfs cornnectron. send (bY") 


elif self.cientMsg=="'N'": 
self.chatText.insert (tkinter.END, ' 服 务 器 端 与 客户 端 建立 连接 


self.connection:send (byN") 
else: 
theTime=time.strftime ("%Y-%m-%d %H:%M:%S", time.localtime ()) 


self .chatText.insert (tkinter.END, ' 客 户 端 ' + theTime + 说: \n') 
self.chatText.insert (tkinter.END, ' ' + self.cientMsg) 


# 发 送 消息 

def sendMessage (self): 
# 得 到 用 户 在 Text 中 输入 的 消息 
message=self.inputText .get ('1.0',tkinter .END) 
# 格 式 化 当前 的 时 间 
theTime=time.strftime ("%Y-—%m-—%d %H:%M:%S", time.localtime()) 
self .chatText .insert (tkinter .END, ' 服 务 器 ，+theTime+' 说， \n') 
self.chatText.insert (tkinter.END,' '+messaget+' \n') 


if self.flag==True: 
# 将 消息 发 送 到 客户 端 
self.connection.send (messade.-encode () ) 


else : 


#Socket 连接 没有 建立 ， 提 示 用 户 
self.chatText .insert (tkinter.END，' 您 还 未 与 客户 端 建立 连接 , 客户 端 无 法 
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收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message. len  ()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close (self): 
SYS .exit () 
# 启 动 线程 接收 客户 端的 消息 
def startNewThread (self): 
# 启 动 一 个 新 线程 来 接收 客户 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 图 数 不 需 要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=self.receiveMessage,args=()) 
thread.setDaemon (True) ; 
thread.start () ; 
四 下 -333 
SeTVeTr=SeTrVerUI() 
server.startNewThread () 
SerVer .root .malnloop () 
if name ==' main ': 


main () 


13.3.2 ”在线 聊天 程 友 的 竹 尸 病 


在 客户 端 设 计 ClientUI 类 ， 封 装 接收 消息 图 数 方法 receiveMessage(sel 人 由、 发 送 消息 
sendMessage(se] 旬 ， 并 在 构造 图 数 中 完成 Tkinter 界面 布局 。 

在 客户 问 建 并 Socket 后 ， 同 服务 器 发 送 字 从 Y， 表 示 客 户 问 要 连接 服务 器 。 服 务 器 妆 
收 到 后 会 返回 字符 Y 信息， 表明 连接 建立 成 功 。 在 连接 建立 成 功 后 即 可 不 断 接 收服 务 器 发 
来 的 聊天 信息 

下 面 是 客户 闹 代 码 : 


#Filename:ClientUI .py 
#Python 在 线 聊天 客户 端 2016-2-12 
import tkinter 
import tkinter.font as tkFont 
import socket 
import threading 
import time,tsys 
el 
liocal— T2720051 
port=5505 
global clientsock; 
flag=False 
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# 初 始 化 类 的 相关 属性 的 构造 函数 

def init (self): 
sglf TOOt EkTnter. Tk 
self.root.title('Python 在 线 聊 天 -客户 端 V1 .01') 
# 窗 口 面 板 ， 用 4 个 面板 布局 
self.frame=[tkinter.Frame (),tkinter.Frame(),tkinter.Frame(), 
trintere Framet(il 
# 以 下 界面 设计 与 服务 器 端 相同 
# 显 示 消 息 Text 右边 的 滚动 条 
self .chatTextSecrollBar tkinters scrolibar(self framel0i} 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fi1l=tkinter.Y) 
# 显示 消 息 Text， 并 绑 定 上 面 的 滚动 条 
ft= 七 KFont .Font (family="'Fixdsys"',size=11) 
self.chatText=tkinter.Listbox(self.frame[0],width=70,height=18, font=ft) 


self.chatText["'yscrollcommand"]=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fil1l=tkinter .BOTH) 
self.chatTextScrollBar['command']=self.chatText.yview () 
self.frame[0] .pack (expand=1, fil1l=tkinter .BOTH) 

# 标 签 ， 分 开 消 息 显 示 Text 和 消息 输入 Text 

label=tkinter.Label (self.frame[l1],height=2) 

label.pack (fill=tkinter .BOTH) 
self.frame[l1] .pack (expand=1, fil1l=tkinter .BOTH) 

# 输 入 消息 Text 的 滚动 条 

self.inputTextScrollBar=tkinter.SsScrollbar (self.frame[2]) 
self.inputTextScrollBar.pack (side=tkinter.RIGHT, fil1l=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 

ft=tkFont.Font (family="'Fixdsys"',s1ize=11) 
self.inputText=tkinter.Text (self.frame[2],width=70, height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=1, fil1l=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview () 
self.frame[2] .pack (expand=1, fil1l=tkinter .BOTH) 

#“ 发 送 ”按钮 

self.sendButton=tkinter.Button (selLf.frame[3] ,text=" 发 送 ， 本 
width=10,command=self.sendMessage) 
self.sendButton.pack (expand=1, side=tkinter.BOTTOM and tkinter 
.RIGHT, padx=15,pady=8) 

#“ 关 闭 ” 按 钮 

self.closeButton=tkinter.Button (self .frame[3],text=' 关 闭 ' , width=10， 
command=self.close) 


self.closeButton.pack (expand=1, side=tkinter.RIGHT,padx=15,pady=8) 
self.frame[3] .pack (expand=1, fil1l=tkinter .BOTH) 
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# 接 收 消息 
def receiveMessage (self): 
电玩 
# 建 立 Socket 连接 
self.clientSock=socket .socket (Socket.AF INET, socket.SOCK STREAM) 
self.clientSock.connect ((self.local，self.port) ) 
Selft .flag=TITFrue 
except: 
self .flag=False 
self.chatText .insert (tkinter .END, ' 您 还 未 与 服务 器 端 建立 连接 , 请 检查 服 
务 器 是 否 启动 ') 


return 
self .buffer=1024 
self.clientSock.send('Y' .encode () ) # 回 服务 器 发 送 字符 了 Y， 表 示 客 户 端 要 连接 服务 器 


while True : 
ER 

1f self.flag==True: 
# 连 接 建 立 ， 接 收服 务 器 端 消息 
self.serverMsg=self.clientSock.recv (self.buffer) 
.decode ("'utf-8°") 
if self.serverMsg=="'Y": 

self.chatText.insert (tkinter.END, ' 客户 端 已 经 与 服务 器 端 


elif self.serverMsg=='N'": 


self.chatText.insert (tkinter.END, ' 客户 端 与 服务 器 端 建立 


elif not self.serverMsg: 
continue 

else: 
theTime=time.strftime ("%Y-%m-%d %H:%M:%S", time 
ocaltimet(t)) 


self.chatText.insert (tkinter.END, ' 服 务 器 端 ' + theTime 


Fe Mn) 
self.chatText.insert (tkinter.END, ' ' + self.serverMsg) 
else: 
break 


except EOFError as msg: 
ralse msg 
SelFf oClLientsock Ts 区 从 
break 
# 发 送 消 息 
def sendMessage (self): 


261 | 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


# 得 到 用 户 在 Text 中 输入 的 消息 
message=self.inputText .get ('1.0',tkinter .END) 

# 格 式 化 当前 的 时 间 

theTime=time.strftime ("%Y-%m-—%d %H:%M:%S", time.localtime ()) 
self .chatText .insert (tkinter .END, ' 客 户 端 器 ' + theTime +' 说 : \n') 


self.chatText.insert (tkinter.END,' ' + message + '\n') 
if self.flag==True: 

self.clientSock.send (message.encode () ) ; # 将 消息 发 送 到 服务 器 端 
else: 


#Socket 连接 没有 建立 ， 提 示 用 户 
self .chatText .insert (tkinter.END,，' 您 还 未 与 服务 器 冰 建 立 连接 , 服务 器 端 
无 法 收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message. len  ()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close(self): 
SYS .exit () 
# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread (self): 
# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 钞 数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=self.receiveMessage,args=()) 
thread.setDaemon (True) ; 
thread.start () ; 
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Client Che 
client startNewThreadl) # 启 动 线程 接收 服务 器 端的 消 妃 


client.root .mainloop() 


”name =="' main '": 


maint) 


网 络 通 信 和 案例 一 一 基于 
UDP 的 网 络 五 于 棋 游 戏 


14.1 网 络 五 子 棋 游 戏 简介 


五 子 棋 是 一 种 家 喻 户 晓 的 棋 类 游戏 ， 它 的 多 变 吸 引 了 无 数 玩 家 。 本 章 设 计 的 五 子 棋 游戏 
是 一 简易 五 子 棋 ， 柑 盘 为 15x15， 黑 子 先 落 。 在 每 次 下 棋子 前 先 判 断 该 处 有 无 棋子 ， 有 则 不 
能 沙子， 超出 边界 不 能 沙子 。 任 何 一 方 有 达到 横 同 、 竖 同 、 斜 癌 、 反 和 斜 回 连 到 5 个 棋子 则 胜 
利 。 

本 章 介 绍 基于 UDP 的 Socket 编程 方法 来 制作 网 络 五 子 棋 游 戏 程 序 。 网 络 五 子 棋 游戏 
采用 C/S 架构 ,分 为 服务 器 端 和 客户 端 。 服 务 器 羡 运 行 界 面 如 图 14-1 所 示 ， 在 游戏 时 服务 
兢 病 首先 启动 ， 当 客户 端 连 接 后 服务 器 端 可 以 走 棋 。 


[ff 局 放 五子 棋 V20-- 服 务 证 总 


| 


图 14-1 网 络 五 子 棋 游戏 的 服务 器 端 界 面 


P 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
用 户 根据 提示 信息 ， 轮 到 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 时 下 方 标签 会 显示 对 方 的 
走 棋 信 息 ， 服 务 器 端 用 户 通 过 “退出 游戏 ”按钮 结束 游戏 。 
客户 端 运 行 界面 如 图 14-2 所 示 ， 需 要 输入 服务 器 的 IP 地 址 (这 里 采用 默认 地 址 ， 即 
本 机 地 址 ), 如 果 正 确 且 服务 器 启动 则 可 以 连接 服务 器 。 连 接 成 功 后 客户 端 用 户 根据 提示 信 
息 ， 轮 到 上 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 样 可 以 通过 “退出 游戏 ”按钮 结束 游戏 。 


| 诈 :5 
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图 14-2 网 络 五 子 棋 游 戏 的 客户 端 界 面 


14.2 ”五子 棋 游 戏 的 设计 思想 


在 下 棋 过 程 中 ， 为 了 保存 所 下 过 棋子 的 信息 ， 使 用 列表 map。map[x][y] 存 储 棋 盘 (x,y) 
处 棋子 的 信息 ， 如 果 为 0 代表 黑子 ， 为 1 代表 日 子 。 

游戏 运行 时 ， 在 鼠标 单 击 事件 中 判断 单 击 位 置 是 否 合法 ， 即 不 能 在 已 有 棋子 的 位 置 单 
击 ， 也 不 能 超出 游戏 棋盘 边界 ， 如 果 合 法 ， 则 将 此 位 置信 息 加 入 到 map 列表 和 back 列表 
(用 于 悔 棋 )， 同 时 调用 checkWin(x,y) 判 断 游戏 的 输赢 。 

本 游戏 的 设计 关键 是 判断 输赢 的 算法 。 对 于 该 算法 的 具体 实现 ， 大 致 分 为 以 下 几 个 
部 分 : 

(1) 六 

(2) 潮 

(3) 六 

(4) 尖 


断 X=Y 轴 上 是 否 形 成 五 子 连 珠 。 
断 X=-Y 轴 上 是 否 形成 五 子 连 珠 。 
断 Y 轴 上 是 否 形成 五 子 连 珠 。 

断 义 轴 上 是 否 形成 五 子 连 珠 。 


Od 
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以 上 4 种 情况 只 要 任何 一 种 成 立 ， 那 么 就 可 以 判断 输 瓦 。 


def win lose(): # 输 赢 判断 
# 扫 描 整 个 棋盘 ， 判 断 是 否 连 成 5 里 
a=str (turn) 
print ("a=",a) 
For i in rangeldg 11): 坦 0 一 10 
# 判 断 X=Y 轴 上 是 否 形成 五 子 连珠 
For Teinnrange < 0 一 10 
if map[i] [jl]==a and mapl[i+1] [j+1]==a and map[i+2] []+2]==a and 
map[i+3] [j+3]==a and map[i+4] [j+4]==a:print ("Xx=Y 轴 上 形成 五 子 连珠 ") 


return True 


forvivin rangeld 1959). #4 一 1 4 
# 判 源 X=-Y 轴 上 是 否 形成 五 子 连珠 
for J] 31n rangelt0 11) :> 和 0 一 10 


if map[i][j]==a and map[i-1][]+1l]==a and map[i-2] []+2]==a and 
map[i-3] [j+3]==a and map[i-4] [j+4]==a:print ("X=-Y 轴 上 形成 五 子 连珠 ") 


return True 


for 1 in range(0,15): #0 一 14 
# 判 断 Y 轴 上 是 否 形成 五 子 连珠 
for ] in range(4,15): #4 一 14 


if map[1I][]]==a and map[I][]-1]==a and map[1I][]-2]==a and 
ma 站 =31= and maplill] 41==a:print("Y 轴 工 形成 五 于 连珠 了”) 


return True 


for 1 in range(0,11): #0“=10 
# 判 断 x 轴 上 是 否 形成 五 子 连珠 
for ] in range(0,15): #0 一 14 


if map[1I][]]==a and map[1I+1][]]==a and map[i+2] []]==a 
Ts maplirai1i1l = angd maplira]lil =3-Brint("x 机 上 形成 五 于 广 珠 7" 
return True 


return False 


判断 输赢 实际 上 不 用 扫 摘 整个 棋盘 ， 如 果 能 得 到 了 刚 下 的 棋子 的 位 置 (x, y)， 束 不 用 扫 摘 
整个 棋盘 ， 而 仅仅 在 此 棋子 附近 的 横 、 竖 、 和 斜 方 回 均 判 断 一 过 即 可 。 

checkWin(x.y) 判 断 这 个 棋子 是 否 和 其 他 棋子 连 成 五 子 ， 即 判断 输赢 。 它 是 以 (xy) 为 中 
心 通过 横 回 、 纵 回 、 和 斜 方 癌 的 判断 来 统计 相同 颜色 的 棋子 个 数 。 

例如 以 水 平方 向 〈 横 回 ) 的 判断 为 例 ， 以 (x, y) 为 中 心计 算 水 平方 同上 的 棋子 数量 时 首 
先 回 右 最 多 4 个 位 置 ， 如 果 同 色 则 count 加 1， 然后 同 左 最 多 4 个 位 置 ， 如 果 同 色 则 count 
加 1。 统计 完成 后 如 果 count >=5， 则 说 明 水 平方 回 连 成 五 子 。 其 他 方 回 同 理 。 因 为 每 个 方 
同 判 断 前 下 子 处 (x,y) 还 有 己方 一 个 ， 所 以 count 的 初始 值 为 1。 


def checkWin (x,y): 
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flag=False 

count=1 # 保 存 共 有 相同 颜色 的 多 少 棋子 相连 

color=maplx] [yl] 

# 通 过 循环 来 做 棋子 相连 的 判断 

# 横 向 的 判断 

# 判 断 横 回 是 否 有 5 个 棋子 相连 ， 特 点 是 纵 坐 标 相 同 ， 即 map [x] [y] 中 的 y 值 是 相同 

1=1 

while color==map[x+i] [y] : 间 回 右 统计 
count=count+1 
1=1+1 

1=1 

while color==map[x-i] [y] : 音 疝 左 统计 
count=count+1 
1=1+1 

if count>=5: 
flag=True 

# 纵 回 的 判断 

12=1 

count2=1 

while color==map [x] [y+12]: 
count2=count2+]1 
12=12+1 

12=1 

while color==map [X] [Y-12] : 
count2=count2+1 
12=12+1 

if count2>=5: 
flag=True 

# 斜 方向 的 判断 〈 右 上 + 左下 ) 

13=1 

count3=1 

while color==map [x+13] [y-13]: 
count3=count3+]1 
13=13+1 

13=1 

while color==map [x-13] [y+13] : 
count3=count3+1 
13=13+1 

1f count3>=5: 
flag=True 

# 和 斜 方向 的 判断 〈 右 下 + 左上 )》 

14=1 
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count4=1 

while color==map [x+1i4] [y+1i4]: 
count4=count4+1 
14=14+1 

14=1 

while color==map [x-14] [y-14]: 
count4=count4+1 
14=14+1 

if count4>=5: 
flag=True 


return flag 


在 本 程序 中 每 下 一 步 棋子 ， 调 用 checkWin(x,y) 函数 判断 是 否 已 经 连 成 五 子 ， 如 果 返 
回 True， 则 说 明 已 经 连 成 五 子 ， 显 示 输 局 结 果 对 话 杠 。 


14.3 ”关键 技术 


14.3.1 UDP 编程 


rr 
对 于 TCP，UDP 则 是 面向 无 连接 的 协议 。 视频 讲解 

在 使 用 UDP 协议 时 不 需要 建立 连接 ， 只 需要 知道 对 方 的 IP 地 址 和 端口 号 就 可 以 直接 
发 数据 包 ， 但 是 能 不 能 到 达 就 不 知道 了 。 虽 然 用 UDP 传输 数据 不 可 靠 ， 但 它 的 优点 是 和 
TCP 相 比 速度 快 ， 对 于 不 要 求 可 靠 到 达 的 数据 可 以 使 用 UDP 协议。 

通过 UDP 协议 传输 数据 和 TCP 类 似 , 使 用 UDP 的 通信 双方 也 分 为 客户 端 和 服务 器 端 。 

图 14-3 所 示 为 无 连接 UDP 的 时 序 图 。 

服务 器 客户 机 


服务 请 求 
服务 应 从 
Close() Close() 


图 14-3 无 连接 UDP 的 时 序 图 
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对 于 UDP C/S， 客 户 机 并 不 与 服务 器 建立 一 个 连接 ， 而 仅仅 调用 函数 SendTo0 给 服务 
髓 友 送 数据 报 。 类 似 地 , 服务 器 也 不 从 客户 端 接收 一 个 连接 ,只 是 调用 函数 ReceiveFrom()， 
等 待 从 客户 端 来 的 数据 。 通 常 ， 依 照 ReceiveFrom0) 得 到 的 协议 地 址 以 及 数据 报 ， 服 务 器 就 
可 以 给 客户 送 一 个 应 答 。 

[ 例 ]14-1 编写 一 个 简单 的 UDP 演示 下 棋 程 序 。 服 务 器 端 把 UDP 客户 端 发 来 的 下 棋 
坐标 信息 (x,y) 显 示 出 来 ， 并 把 坐标 加 1 后 (模拟 服务 器 端 下 棋 ) 再 发 给 UDP 客户 端 。 

服务 器 首先 需要 绑 定 8888 闻 口 : 


import socket # 导 入 socket 模块 
Ss=socket .socket (socket.AF INET, socket.SOCK DGRAM) 
a bindltl i270 0 1 0000)1 # 绑 定 端口 


在 创建 Socket 时 , SOCK DGRAM 指定 了 这 个 Socket 的 类 型 是 UDP。 绑 定 问 口 和 TCP 
一 样 ， 但 是 不 需要 调用 listen(0) 方 法 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 : 


PrInEel Blnd UDP on 8888“) 
while True : 
# 接 收 数据 
data, addr=s.recvfrom(1024) 
print ('Received from $s:%s.' $ addr) 
Print ('received:',data) 
p=data.decode ('utf-8') .split(","); #qecode () 解 码 ， 将 字 节 串 转换 成 字符 串 
x=1int (p[0]); 
y=int(p[l11): 
print (p[0],p[1]) 
Passskeix el) # 模 拟 服 务 器 端 下 棋 的 位 置 
s.sendto (pos .encode ('utf-8'),addr) # 发 回 客户 端 


recvfromO 方 法 返回 数据 和 客户 端的 地 址 与 端口 ， 这 样 服务 嚣 收 到 数据 后 直接 调用 
sendto0) 就 可 以 把 数据 用 UDP 友 给 客户 新 。 

在 客户 端 使 用 UDP 时 ， 首 先 创建 基于 UDP 的 Socket， 然 后 不 需要 调用 connect()， 直 
接 通过 sendto() 给 服务 器 发 数据 : 


import socket # 导 入 socket 模块 

Ss=socket .socket (socket .AF INET, socket.SOCK DGRAM) 

x=input ("请 输入 zx 坐标 ") 

y=input ("请 输入 y 坐标 ") 

data=str(x} "> "T+Sstr(y) 

= Sendto(ldgtaencoderr uf = 8 ow T2100 8888)) 
#encode () 编码 ， 将 字符 串 转 换 成 传送 的 字 节 串 

# 接 收服 务 器 加 1L 后 的 坐标 数据 

data2, addr=s.recvfrom(1024) 

print ("接收 服务 器 加 1 后 坐标 数据 : "，data2 .decode ('utf-8')) 
#decode () 解 但 


S-ClLose () 
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从 服务 侣 接收 数据 仍然 调用 recvfrom() 方 法 。 
这 里 仍然 用 两 个 命令 行 分 别 局 动 服务 器 和 客户 端 测试 ， 运 行 效果 如 图 14-4 和 图 14-5 
所 示 。 


YP C\Windows\py.exe 


Bind UDP on 8888... 
Received from i127.0.0.1:62893. 


图 14-5 客户 并 程序 效果 


上 面 模拟 了 服务 器 端 和 客户 端 两 方 下 棋 时 的 通信 过 程 ， 有 此 基础 可 以 实现 基于 UDP 
的 网 络 五 子 棋 游 戏 ， 真 正 开发 出 实用 的 网 络 程序 。 


14.3.2” 自 定义 网 络 五 子 棋 游 戏 的 通信 协议 


网 络 五 子 棋 洲 戏 的 设计 难点 在 于 需要 与 对 方 通信 , 这 里 使 用 了 面 回 非 连接 的 Socket 编 
程 。Socket 编程 用 于 开发 C/S 结构 程序 ， 在 这 类 应 用 中 ， 和 客户 疹 和 服务 器 问 通 音 需 要 先 建 
立 连接 ， 然 后 友 送 和 接收 数据 ， 交互 完成 后 需要 断 开 连接 。 本 章 的 通信 采用 基于 UDP 的 
Socket 编程 实现 。 虽然 这 里 两 台 计 算 机 不 分 主 次 , 但 在 设计 时 假设 一 台 做 服务 器 端 ( 黑 方 )， 
等 待 其 他 人 加 入 。 AN ea 
是 “输赢 信息 ”“ 下 的 模子 位 置信 息 ?”“ 结 束 游戏 ”等 ， 在 友 送 信息 的 首部 加 上 标识 。 因 此 
定义 了 如 下 协议 : 

@ movel 下 的 棋子 位 置 坐 标 (x,y) 

例如 ,“movel7.4” 表 示 对 方 下 子 位 置 坐标 (7.4)。 


对 overl 哪 方 赢 的 信息 
例如 ,“over | 黑 方 你 局 了 ”表示 黑 方 启 了 。 
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©@ exit | 

表示 对 方 离开 了 ， 游 戏 结束 。 
@ joinl 

其 表示 连接 服务 器 。 


当然 ， 可 以 根据 程序 功能 增加 协议 ， 例 如 悔 棋 、 文 字 聊 天 等 协议 。 由 于 本 程序 没有 设 
计 “ 人 悔 模 ”和 “文字 聊天 ”功能 ， 所 以 没 定义 相应 的 协议 ， 读 者 可 以 目 己 完善 程序 。 

在 程序 中 根据 接收 的 信息 (当然 都 是 字符 串 ) 通 过 字符 串 .split("|)) 获 取消 息 类 型 (move、 
join、exit 或 者 over)， 从 中 区 分 出 “输赢 信息 over”“ 下 的 棋子 位 置信 息 move” 等 ， 代 码 
如 下 : 


def receiveMessage(): # 接 收 消息 函数 
global 5s 
while True: 

# 接 收 客户 端 发 送 的 消息 

global addr 

data, addr=s.recvfrom(1024) 

data=data.decode("'utf-8°"') 

a=data.split ("|") # 分 割 数据 

if not data: 
print ('client has exited!') 
break 

efi aldl== om: # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! ， 

ED # 对 方 退 出 信息 
print ('client 对 方 退出 !') 
labell["text"]='client 对 方 退出 ， 游 戏 结束 ! ， 

elif a[0]=="'over': # 对 方 万 信息 
print ('" 对 方 赢 信 息 ! ' ) 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split("|") [1]) 

elif a[0]=="'move"': # 客 户 端 走 的 位 置信 息 ， 例 如 "move17,4" 
Print ('received:',data,'from',addr) 
BolUule apt) 
x=1nt(p[lOl})s 
y=int (p[1]); 
prinE(pr0ol piLll) 
labell["text"]=" 客 户 端 走 的 位 置 "+p[0] +p[1] 
drawotherChess (x, y) # 男 对 方 棋子 


s.close!() 


掌握 通信 协议 以 及 单机 版 五 子 棋 游 戏 的 知识 之 后 就 可 以 开发 网 络 五 子 棋 游戏 了 。 
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14.4 ”网 络 五 子 棋 游 戏 程序 设计 的 步 又 


14.4.1 服务 絮 病 程序 设计 的 步 双 pe 


@ 主 程序 

定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
绘制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 
单 击 事件 。 

同时 创建 UDP 通信 服务 器 端的 SOCKET， 绑 定 在 8000 端口 ， 启 动 线程 接收 客户 端的 
消息 ， 最 后 的 rootmainloop() 方 法 是 进入 窗口 的 主 循环 ， 也 就 是 显示 窗口 。 


from tkinter import * 

from tkinter.messagebox import * 
import socket 

import threading 


import os 


root=TKk () 

root .title ("网 络 五 子 棋 V2 .0 一 服务 器 端 ") 

# 五 子 棋 一 一 夏 敏 捷 2016-2-11 

imgs=[PhotoImage (file="'D:\\python\\bmp\\BlackSstone.gif"'), 
PhotoImage (file='D:\\python\\bmp\\Whitestone.g1if")1] 


Loirei=0 # 轮 到 哪 方 走 棋 ，0 是 黑 方 ，1 是 白 方 
Myturn=-1 # 保 存 自 己 的 角色 ，-1 表示 还 没 确定 下 来 
map= [ 3 LL wm wm TT? ww 1 TFT - wm wm TT? ww TFT TFT 中 wm wm TT Ld TT ww ww wm . 1TT Li TT TT ww wm 1 a Or y 


in range (15)] 
CVv=Canvas (root, bg="'green', width=610, height=610) 
drawQiPan () # 绘 制 15x15 的 游戏 棋盘 


cv.bind("<Button-1>", callpos) 


Cy Dack(l 

labell=Label (root, text=" 服 务 器 端 ...") # 显 示 提 示人 信息 
labell .pack () 

button1=Button (root, text=" 退 出 游戏 ") # 按 钮 


buttonl .bind ("<Button-1>", callexit) 

DuconL- packt} 

# 创 建 UDP SOCKET 

S=SOCKet .socket (socket .AF INET, socket .SOCK DGRAM) 

sind(tl Iocalhost" 8000)) 

addr=("'localhost",8000) 

startNewThread () # 启 动 线程 接收 客户 端的 消 乱 
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recelVeMessade (); 


root .malnloop() 


@ 退出 函数 
“退出 游戏 ”按钮 单 击 事件 的 代码 很 简单 ， 仅 仅 有 友 送 一 个 "exit|" 命 令 协 议 消息 ， 最 后 调 
用 os.exit(0) 结 束 程序 。 


daf callerzit levent): # 退 出 
pos="exit|" 
sendMessage (pos) 


os. exit (0) 


全 走 棋 函数 

在 鼠标 单 击 事件 中 完成 走 棋 功 能 ， 判 断 单 击 位 置 是 否 合法 ， 既 不 能 在 已 有 棋 的 位 置 单 
击 ， 也 不 能 超出 游戏 棋盘 边界 ， 如 果 合 法 ， 则 将 此 位 置信 息 记 录 到 map 列表 (数组 ) 中 。 

同时 由 于 是 网 络 对 战 ， 第 一 次 走 棋 时 还 要 确定 自己 的 角色 (是 白 方 还 是 黑 方 )， 而 且 
要 判断 是 否 轮 到 目 己 走 棋 。 这 里 使 用 两 个 变量 Mytum、tur 来 解决 。 

Myturn=-1 # 保 存 自 己 的 角色 


Myturm 是 -1 表示 还 没 确定 下 来 ， 在 第 一 次 走 棋 时 修改 。 

tum 保存 轮 到 谁 走 棋 ， 如 果 tum 是 0 表示 轮 到 黑 方 ，turn 是 1 表示 轮 到 日 方 。 

最 后 是 本 游戏 的 关键 一 一 和 输赢 判断 。 在 程序 中 调用 win lose0 函 数 判 断 输 启 ， 判断 在 4 
种 情况 下 是 否 连 成 五 子 ， 返 回 True 或 False。 根 据 当 前 走 棋 方 tum 的 值 (0 为 黑 方 ，1 为 日 
方 ) 得 出 谁 说 。 

目 己 走 完 后 轮 到 对 方 走 棋 。 


def callpos (event) : # 走 棋 
Jlobales turn 
global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 (是 白 方 还 是 黑 方 ) 
Myturn=turn 
else: 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 棋 ") 
return 
#print ("clicked at", event.x, event.y, turn) 
x= (event .x) //40 # 换 算 棋盘 坐标 
y= (event.y)//40 
Eee eaekeg ak am Er 
if maplx][lvi'=" ™": 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
else: 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),1image=img1) # 画 自己 的 棋子 


CE -packt) 
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map [X] [y]=str (turn) 
pos=str (x)+","+str (y) 
sendMessage ("movel|"+pos) 
print ("服务 器 走 的 位 置 "，, pos) 
labell["text"]=" 服 务 器 走 的 位 置 "+pos 
# 输 出 输赢 信息 
a Hin liosely Penie: 
if turn==0: 
showinfo (tit1le=" 提 示 " ,message=" 黑 方 你 赢 了 ") 
sendMessage ("over| 黑 方 你 赢 了 ") 
else: 
showinfo (title=" 提 示 ",message=" 白 方 你 盛 了 ") 
sendMessage ("over | 日 方 你 记 了 ") 
# 换 下 一 方 走 棋 
1f turn==0: 
turn=1 
else: 


turn=0 


@ 画 对 方 棋子 
当 轮 到 对 方 走 棋子 后 ， 在 目 己 的 棋盘 上 根据 tum 知道 对 方 角色 ， 从 socket 获取 对 方 走 
棋 坐 标 (x,y)， 从 而 画 出 对 方 棋子 。 在 男 出 对 方 棋子 后 ， 同 样 换 下 一 方 走 棋 。 


def drawOotherChess (x, y): # 男 对 方 棋子 


global turn 

imgl=imgs [turn] 

cv.create image ((x*40+20,y*40+20),1image=img1) 
Cv Dacktl 

maplx] [y]=str (turn) 

# 换 下 一 方 走 棋 


LE 


turn=1 
else: 
turn=0 
全 面 棋盘 
drawQiPan0 男 15x15 的 五 子 棋 棋 盘 。 
def drawQiPan (): # 男 棋盘 


fory an rangel0s loys 


cv.create line(20,20+40*1,580,20+40*1,width=2) 


for 1 in range(0,15): 


cv.create line(20+40*1,20,20+40*1,580,width=2) 


Cv- Dack() 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


@ 输赢 判断 
win lose() 从 4 个 方 回 扫描 整个 棋盘 ， 判 断 是 否 连 成 5 子 。 
def win lose(): # 输 赢 判 断 

# 扫 描 整 个 棋盘 ， 判 断 是 否 连 成 5 子 

a=str (turn) 

print ("a=",a) 


for 1 in range(0,11): 


# 判 断 X=Y 轴 上 是 否 形 成 五 子 连珠 


for ] in range(0,11): 着 0 一 10 
if map[i][j]==a and map[i+1] [Jj+1]==a and map[i+2] []+2]==a and 


map [i+3] [j+3]==a and map [i+4] [j+4]==a:print ("X=Y 轴 上 形成 五 子 连珠 ") 


#0 ”10 


return True 
For In rangqeld 15): 着 4 一 14 


# 判 断 X=-Y 轴 上 是 否 形成 五 子 连珠 
for ] in range(0,11): #0 一 10 
if map[1][]]==a and map[i-1] [Jj+1]==a and map[i-2] []+2]==a and 
map[i-3] [j+3]==a and map[i-4] [j+4]==a:print ("Xx=-Y 轴 上 形成 五 子 连珠 ") 


return True 
for 1 in range(0,15): 0 一 14 


# 判 断 Y 轴 上 是 否 形成 五 子 连珠 

Tory J on rangeld4 19) 和 4 一 14 
if map[1I][]]==a and map[1I][]-1]==a and map[1I][]-2]==a and 
atinlll 31 sandgnaera SEE 二 形成 重 于 二 环 邱 


return True 
For Hn rangel0 11): #0 一 10 


判断 xX 轴 上 是 否 形成 五 子 连珠 
for ] in range(0,15): #0 一 14 


if map[1I][]]==a and map[1I+1][]]==a and map[i+2] []]==a and 
mplir3al1ll 2 ang mapl04l1l11 3671inE("X 负 上 上 形成 于 于 六 珠 " 
return True 
return False 


@ 输出 map 地 图 
这 里 主要 是 显示 当前 棋子 信息 。 


def print map(): # 输 出 map 地 图 
for in range(0, 15) #0 一 14 
For LT Ln range(l0 工科 0 一 14 
print (map[I][]],endq=' ') 
Eramke tw) 
人 @ 接收 消息 
从 data 字符 串 .split("I 门 中 分 割 出 消息 类 型 


本 程序 的 关键 部 分 就 是 接收 消 恩 data， 
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(move、join、exit 或 者 over)。 如 果 为 JoIn'"， 是 客户 端 连接 服务 器 请 求 ;， 如 果 为 'exit'， 是 对 
方 客户 端 退 出 信息 ; 如 果 为 ' move '， 是 客户 端 走 的 位 置信 息 ; 如 果 为 ' over '， 是 对 方 客户 
症 太 的 信息 。 这 里 重点 处 理 对 方 的 走 棋 信 息 ， 例 如 “movel7,4”， 通 过 字符 串 .split(",") 分 割 
出 (x.y) 坐 标 。 


def receiveMessage(): 
global Ss 
while True: 

# 接 收 客户 端 发 送 的 消息 

global addr 

data, addr=s.recvfrom(1024) 

data=data.decode("'utf-8°"') 

a=data.split ("|") # 分 割 数 据 

if not data: 
print('client has exited!') 
break 

eit I= "Or # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! ， 

EN en # 对 方 退 出 信息 
print("client 对 方 退 出 1'”) 
labell["text"]='client 对 方 退出 ， 游 戏 结束 ! ， 

人 TOOweE # 对 方 赢 信 息 
print (' 对 方 赢 信 息 ! ) 
labell["text"]=data.split ("|") [0] 
showinfto(ltitie=" 提 示 " message=data2split("]")[1]1) 

elif al0l== "move”: # 客 户 端 走 的 位 置信 息 "move|7,4" 
Print ('received:',data,'from',addr) 

Eee seo 

x=1nt (Pp[01); 

FIELD 

Preciplol erly 

labell["text"]=" 客 户 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 男 对 方 棋子 


Ss.close!() 
@ 发 送 消 息 
发 送 消 息 的 代码 很 简单 ， 调 用 Socket 的 sendto0O) 函 数 就 可 以 把 按 协 议 写 的 字符 串 信息 
def sendMessage (Pos) : # 发 送 消息 


global 5s 
global addr 
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和 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


S-Senato (pos .encode () ,add7) 
人 电 启动 线程 接收 客户 端的 消息 


局 动 线程 接收 客户 问 的 消 奶 

def startNewThread(): 
# 司 动 一 个 新 线程 来 接收 客户 器 端的 消息 
#thread.start new thread (funct1lion,ards[,kwardgqs]) 
# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 
# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 
#receiveMessage 国 数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True);) 


thread.start () ， 


至 此 完成 服务 器 病程 序 设计 。 图 14-6 所 示 为 服务 句 问 走 棋 过 程 中 打印 的 输出 信息 。 网 
络 五 子 棋 的 客户 闯 程 序 设 计 基 本 上 与 服务 器 端 相似 ， 主 要 区 别 在 消息 处 理 上 。 


PP C\Windows\py.exe 


client ] 主 榜 服 务 翅 * 
clicked at 5 i11i 0 
a= = 


服务 器 走 的 1 位 置 5.1i 
received: 6.11 from 127.0.0.1,. 49358> 
有 11 
a= 1 
a= 1 
clicked at 6 10 日 
a= 日 
0 


服务 器 走 的 位 置 6.18 


received: ?7.18 from <’127.0.0.1’,. 49358> 


clicked at 6 9 0 
a = 0 


记 务 器 走 的 位 置 6.9 


received: 7.9 from CC’127.0.0.1’,. 49358> 


图 14-6 走 棋 过 程 中 打印 的 输出 信息 


14.4.2” 冤 尸 病程 友 设 计 的 步 又 


@ 主 程序 

定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
绘制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 
单 击 事件 。 

同时 创建 UDP 通信 客户 端的 SOCKET， 这 里 不 指定 端口 ， 会 自动 绑 定 某 个 空闲 端口 ， 


| 276 


第 14 章 网 络 通信 案例 一 一 基于 UDP 的 网 络 五 子 棋 游 戏 | 4 


由 于 是 客户 问 SOCKET， 需 要 指定 服务 器 端的 IP 和 端口 号 ， 并 发 出 连接 服务 器 端 请 求 。 
启动 线程 接收 服务 器 端的 消息 ， 最 后 的 rootmainloop(0) 方 法 是 进入 窗口 的 主 循环 ， 也 


~ Easy 和 -< 
就 是 显示 窗口 。 


from tkinter import * 

from tkinter.messagebox import * 

import socket 

import threading 

import os 

root=Tk () 

root .title ("网 络 五 子 棋 V2 .0 一 UDP 客户 端 ") 

imgs=[PhotoImage (file="'D:\\python\\bmp\\BlackSstone.gif"), 
PhotoImage (file='D:\\python\\bmp\\WhiteSsStone.gif")] 
turn=0 

Myturn=-1 

ee 
range (15)1] 

CVv=Canvas (root, bg="'green', width = 610, height = 610) 
drawQiPan () 

ev-bind("<Button—1>" calLiback) 

Cv.pack'(} 

label1=Label (root, text=" 客 户 问 ...") 

labell .pack () 

buttonl=Button (root, text=" 退 出 游戏 ") 

buttonl bind("™Batton= lS"™ callexit) 

Duttonl packt(} 

# 创 建 UDP SOCKET 

Ss=socket .socket (socket .AF INET, SOCKet .SOCK DGRAM) 


port=8000 # 服 务 器 端口 
host="10Ccalhost" # 服 务 器 地 址 192 .168.0.101 
GEOISni #“ 连 接 服务 器 ”命令 
sendMessage (pos); # 发 送 连接 服务 器 请 求 
startNewThread () # 启 动 线程 接收 服务 器 端的 消息 


receiveMessage (); 


root .mainloop () 


@ 退出 函数 
“退出 游戏 ”按钮 单 击 事件 的 代码 很 简单 ， 仅 仅 发 送 一 个 "exit| "命令 协 议 消息 ， 最 后 调 
用 os.exit(0) 结 束 程 序 。 


det eal larzit tow nb # 退 出 


pos="exit|" 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


sendMessage (pos) 


Ds exTtl0) 


全 走 棋 函数 
其 功能 与 服务 器 端 相 同 ， 仅 仅 是 提示 信息 不 同 。 
def callback (eventl: # 走 棋 


| 278 


global turn 
global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 (是 白 方 还 是 黑 方 ) 
Myturn=turn 
else: 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 械 ") 
return 
#print ("clicked at", event.x, event.y, turn) 
x= (event .x) //40 # 换 算 棋盘 坐标 
y= (event.y)//40 
Print elicked aL ytDrnl 
if map[X] [y] !=" ": 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
else: 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),image=img1) 
Cv -Dack(l 
map [X] [y]=str (turn) 
pos=str (x)+", "+str (y) 
sendMessage ("move|"+pos) 
print ("客户 端 走 的 位 置 "，, pos) 
labell["text"]=" 客 户 端 走 的 位 置 "+pos 
# 输 出 输赢 信息 
EE 
1f turn==0: 
showinfo (tit1le=" 提 示 ", message=" 黑 方 你 赢 了 ") 
sendMessage ("over | 黑 方 你 万 了 ") 
else: 
showinfo (title=" 提 示 ",message=" 白 方 你 赢 了") 
sendMessage ("over | 日 方 你 万 了 ") 
# 换 下 一 方 走 棋 
1f turn==0: 
turn=l 
else: 


turn=0 


第 14 章 网 络 通信 案例 一 一 基于 UDP 的 网 络 五 子 棋 游戏 


@@ 画 棋 盘 
drawQiPan0 国 15x15 的 五 子 棋 棋 盘 。 
def drawQipPan (): # 另 棋盘 


for 1 in range(0.15): 

Cv.create line(20,20+40*1,580,20+40*1,width=2) 
for 1 in range(0,15): 

cv.create line(20+40*1,20,20+40*1,580,width=2) 


cv Tackt) 


@ 输赢 判断 

win lose() 从 4 个 方 回 扫 摘 整个 棋盘 ， 判 断 是 否 连 成 五 子 。 其 功能 与 服务 器 问 相 同 ， 代 
码 没 有 区 别 ， 因 此 将 代码 省 略 了 。 

@ 接收 消息 

接收 消息 data, 从 data 字符 串 .split("| 门 中 分 割 出 消息 类 型 (move、join、exit 或 者 over )。 
其 功能 与 服务 器 端 没 有 区 别 ， 仅 仅 是 没有 'join' 消 息 类 型 ， 因 为 客户 端 连 接 服务 器 ， 而 服务 
髓 不 会 连接 客户 端 ， 所 以 少 了 一 个 Join' 消 息 类 型 判断 。 


def recelVeMessage () : # 接 收 消息 
global 5s 
while True: 

data=s.recv(1024) .decode ('utf-8"') 

nt apilit ("|") # 分 割 数据 

if not data: 
Print ('server has exited!') 
break 

= # 对 方 退 出 信息 
print (' 对 方 退 出 !') 
labell["text"]="' 对 方 退 出 ， 游 戏 结束 ! ， 

SE # 对 方 亡 信 息 
print ('" 对 方 赢 信 息 !  ) 
labell["text"]=data.split ("|")[0] 
showinfo (title=" 提 示 ",message=data.split("|") [1]) 

elif a[0]=='move' : # 服 务 器 端 走 的 位 置信 息 
print ('received:',data) 
ESRLE 0) 
x=int (p[0]); 
Y DERBTETY 2 
BEanEtETDOT2 Blu) 
labell["text"]=" 服 务 器 端 走 的 位 置 "+p[0]+p[1] 
drawOotherChess (x, y) # 男 对 方 棋子 ， 函 数 代 码 同 服务 器 端 


S-Close () 
@ 发 送 消息 
皮 送 消息 的 代码 很 简单 ， 仅 仅 调 用 Socket 的 sendto0) 轴 数 ， 就 可 以 把 按 协 议 写 的 字符 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


串 信 息 发 出 。 


def sendMessage (Pos) : # 发 送 消息 
global 5s 
Ss.sendto (pos.encode(), (host, port)) 


@@ 启动 线程 接收 服务 器 端的 消息 


# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread(): 
# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#thread.start new thread (function,args[,kwargs]) 
# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 
# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 
#receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True);) 
thread.start () ， 


全 此 完成 客户 端 程 序 设 计 。 
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中 国 象 模 和 五 子 棋 一 样 ， 也 是 一 种 家 喻 户 晓 的 棋 类 游戏 ， 它 的 多 变 吸 引 了 无 数 玩家 。 
在 信息 化 的 今天 ， 再 用 纸 棋盘 、 木 棋子 下 象棋 有 点 太 落 伍 ， 能 否 来 点 革新 ， 把 古老 的 象棋 
请 进 计算 机 呢 ? 本 章 介绍 制作 “中 国 象棋 ”游戏 的 原理 和 过 程 


15.1 中 国 象 棋 介 绍 


@ 械 盘 

棋子 活动 的 场所 叫 作 “棋盘 ”， 在 长 方形 的 平面 上 ，9 条 平行 的 竖 线 和 
10 条 平行 的 横 线 相交 ， 共 90 个 交叉 点 ， 棋 子 就 摆 在 这 些 交 叉 点 上 。 其 中 的 第 $S、 第 6 两 横 
线 之 间 未 画 竖 线 的 空白 地 带 称 为 “ 河 界 ”， 整 个 棋盘 以 “ 河 界 ”分 为 相等 的 两 部 分 ; 两 方 将 
是 坐镇 、 画 有 “ 米 ” 字 方 格 的 地 方 叫 作 “九宫 ”。 

四 棋子 

象棋 的 棋子 共 32 个 ， 分 为 红 、 黑 两 组 ， 各 16 个 ， 由 对 弈 双方 各 执 一 组 ， 每 组 兵种 是 
一 样 的 ， 各 分 为 7 种 。 

e。 红 方 : 帅 、 仕 、 相 、 车 、 马 、 炮 、 兵 。 

e 黑 方 : 将 、 士 、 象 、 车 、 马 、 炮 、 浴 。 
其 中 ， 帅 与 将 、 仕 与 士 、 相 与 象 、 兵 与 举 的 作用 完全 相同 ， 仅 仅 是 为 了 区 分 红 柑 和 黑 棋 。 

入 各 棋子 的 走 法 说 明 

1) 是 与 将 

移动 范围 : 只 能 在 王宫 内 移动 。 

移动 规则 :每 一 步 只 可 以 水 平 或 牌 直 移动 一 点 。 

2) 仕 与 士 

移动 范围 : 只 能 在 王宫 内 移动 。 

移动 规则 :每 一 步 只 可 以 沿 对 角 线 方 同 移动 一 点 。 


P,. 项 目 案 例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


3) 相 与 象 
移动 范围 : 河 界 的 一 侧 。 


移动 规则 : 每 一 步 只 可 以 治 对 角 线 方 癌 移动 两 点 ， 尺 外 ， 在 移动 的 过 程 中 不 能 够 罕 越 


障 但 。 
4) 马 
移动 范围 : 任何 位 置 。 


移动 规则 : 每 一 步 只 可 以 水 平 或 垂直 移动 一 点 ， 再 按 对 角 线 方 癌 回 左 或 者 问 右 笠 痢 移 


动 一 点 ， 俗 称 “ 马 走 日 >。 另 外， 在 移动 的 过 程 中 不 能 够 穿越 障碍 。 
于 
移动 范围 : 任何 位 置 。 
移动 规则 : 可 以 在 水 平 或 垂直 方向 移动 任意 个 无 阻碍 的 点 。 
6) 炮 
移动 范围 : 任何 位 置 。 


移动 规则 : 移动 起 来 和 车 很 相似 ， 但 它 必 须 跳 过 一 个 棋子 去 吧 抒 对 方 的 一 个 棋子 。 


7) 兵 与 萃 
移动 范围 : 任何 位 置 。 


移动 规则 : 每 一 步 只 能 回 前 移动 一 点 。 过 河 以 后 ， 它 便 增 加 了 回 左 / 右 移动 的 能 力 ， 
不 允许 问 后 移动 。 
@ 关于 胜 、 负 、 和 


在 对 局 中 ， 知 出 现下 列 情 况 之 一 ， 本 方 输 ， 对 方 赢 : 
(1) 己方 的 帅 (将 ) 被 对 方 棋子 吃 掉 。 

(2) 己方 发 出 认输 请 求 。 

(3) 己方 走 棋 超出 步 时 限制 。 


15.2 关键 技术 


@ 移动 指定 图 形 对 象 
使 用 move0) 方 法 可 以 修改 图 形 对 象 〈 例 如 一 个 模子 ) 的 坐标 ， 有 具体 语法 如 下 : 


Canvas 对 象 .move (图 形 对 象 ,x 坐标 偏 移 量 , y 坐标 偏 移 量 ) 


兵 


例如 移动 “是” 棋子 图 片 同 右 150 像素 、 回 下 150 像 系 ， 从 定形 左 上 角 移 到 右 下 角 。 


from tkinter import * 


def callback() : # 事 件 处 理 函 数 
CV.move (rt1,150,150) # 移 动 rt1 

root=TKk () 

root -title('" 移 动 " 帅 "棋子 ' ) # 设 置 窗口 标题 


# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
CVv=Canvas (root, bg="'white', width=260, height=220) 
imgl=PhotoImage (file=' 红 帅 .png') 
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cv.create rectangle(40,40,190,190,outline='red',f1il1l="'green') 
rtl=cv.create image((40,40),image=img1l) # 绘 制 " 帅 "棋子 图 片 
Cv Dackl) 

buttonl=Button (root, text=" 移 动 棋 于 ",Command=callback, fg="red™) 
button]l .pack () 

root .malnloop () 


为 了 对 比 移动 图 形 对 象 的 效果 , 程序 在 (40,40,190,190) 位 置 绘制 了 一 个 矩形 〈 由 绿色 填 


充 )， 单 击 “ 移 动 棋子 ”按钮 后 ,，“ 是 ”棋子 rtl 通过 move0 方 法 移动 到 和 矩形 右 下 和 角 ， 出 现 
如 图 15-1 所 示 的 效果 。 


图 1$-1 移动 “是” 棋子 图 形 对 象 


全 删除 指定 图 形 对 象 
使 用 delete0 方 法 可 以 删除 图 形 对 象 〈 例 如 选中 棋子 的 提示 框 )， 有 具体 语法 如 下 : 


Canvas 对 象 .delete (图 形 对 象 ) 
将 前 面 例子 中 的 最 后 一 行 改 成 如 下 5 行 : 


def callback2(): # 事 件 处 理 函 数 

EdeletLeEETI) 删除 rt1l 
button2=Button (root, text=" 删 除 棋子 " ;: Command=callback2,fg="red") 
DuLtone packl) 


root .mainloop () 


单 击 “删除 棋子 ”按钮 ,“ 帅 ”棋子 消失 ， 出 现 如 图 15-2 所 示 的 效果 。 


图 15-2 删除 指定 图 形 对 象 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


15.3 ”中 国 象 棋 的 设计 思路 


@ 棋盘 的 表示 

棋盘 的 表示 就 是 使 用 一 种 数据 结构 来 描述 棋盘 及 棋盘 上 的 棋 于 ， 这 里 使 用 一 个 二 维 列 
表 chessmap 来 表示 。 一 个 典型 的 中 国 象棋 棋盘 使 用 9x10 的 二 维 列表 (数组 ) 来 表示 ， 每 
一 个 元 素 代 表 棋 盘 上 的 一 个 交点 ， 一 个 没有 棋子 的 交点 所 对 应 的 元 素 是 -1。 一 个 二 维 列 表 
(数组 ) chessmap 保存 了 当前 棋盘 的 布局 。 当 chessmap[x][y]=i 时 说 明 (x,y) 处 是 棋子 图 像 1， 
含 则 chessmap[xj[y]=-1， 表 示 此 处 为 空 〈 无 棋子 )。 

该 程序 中 下 棋 的 棋盘 界面 通过 DrawBoard0) 函 数 在 Canvas 对 象 cv 上 男 出 。 

imgl=PhotoImage (file='D:\\python\\bmp\\ 棋 盘 .png') 

def DrawBoard(): # 男 棋盘 


pl=cv.create image((0,0),image=imgl) 


cv.coords (pl, (360, 400)) # 指 定 棋盘 图 像 的 中 心 点 坐标 为 (360, 400) 
@ 棋子 的 表示 
棋子 的 显示 需要 图 片 ， 每 种 棋子 的 图 案 和 棋盘 使 用 的 对 应 图 片 资 源 如 图 15-3 所 示 。 该 
游戏 中 红 方 在 南 ， 黑 方 在 北 。 


红 仁 .png 红 帅 .png 


图 15-3 ”棋子 图 片 资源 


全 走 棋 规 则 

对 于 象棋 来 说 ， 有 马 走 “日 ” 象 走 “ 田 ”等 一 系列 复杂 的 规则 。 走 法 的 产生 是 博弈 
程序 中 一 个 相当 复杂 而 且 耗 费 运 算 时 间 的 工作 ， 不 过 ， 通 过 民 好 的 数据 结构 可 以 显著 地 提 
局 生成 的 速度 。 

判断 是 人 否 能 走 棋 的 算法 如 下 : 

根据 棋子 名 称 的 不 同 ， 按 相应 规则 进行 判断 。 

(1) 如 果 为 “车 ”， 检 奏 是 售 走 直线， 及 中 间 是 含有 子 。 
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(2) 如 果 为 “ 马 ”， 检查 是 否 走 “ 日 ” 字 ， 是 人 否 炯 脚 。 

(3) 如 果 为 “ 炮 ”， 检 碍 是 人 否 走 直 线 ， 判 断 是 否 吃 子 ， 如 果 吃 子 ， 则 检查 中 间 是 含 只 
有 一 个 棋 和 于 ;如 宁 不 号 ， 则 检查 中 间 是 否 有 棋子 。 

(4) 如 果 为 “ 兵 ” 或 “ 浴 ” 检查 是 否 走 直 线 ， 走 一 步 及 回 前 走 ， 根 据 是 否 过 河 ， 检 查 


(5) 如 果 为 “将 ”或 “ 帅 ”， 检查 是 否 走 直线 ， 走 一 步 及 是 否 超 过 范围 。 

(6) 如 果 为 “ 士 ” 或 “ 仕 ”， 检查 是 否 走 斜 线 ， 走 一 步 及 是 否 超 出 范围 。 

(7) 如 果 为 “ 象 ”或 “ 相 ”， 检 查 是 否 走 “ 田 ” 字 ， 是 人 否 鉴 脚 ， 及 是 否 超 出 光 围 。 

那么 如 何 分 辨 棋子 ? 在 程序 中 采用 了 棋子 图 形 对 象 来 获取 。 

在 该 程序 中 ，IsAbleToPut(id,x,y,oldx,oldy) 函 数 实现 判断 是 否 能 走 棋 并 返回 迎 辑 值 ， 它 
的 代码 较 复 洒 ， 其 参数 合 义 如 下 : 

参数 id 代表 走 的 棋子 图 形 对 象 ; 因为 dict ChessName 字典 中 存储 的 是 id 对 应 的 棋子 
名 【例如 " 红 马 ")， 如 果 qi name = dict ChessName[idj]， 获 取 棋 子 名 含 颜 色 人 信息， 而 字符 串 
[1] 可 以 获取 字符 串 的 第 2 个 字符 ， 所 以 dict ChessName[id][1] 意 味 着 取 字 符 串 的 第 2 个 字 
符 ， 例 如 " 红 马 " 取 第 2 个 字符 得 到 " 马 "。 

参数 x 和 y 代表 走 棋 的 目标 位 置 。 参 数 oldx 和 oldy 代表 走动 棋子 的 原始 位 置 。 

IsAbleToPut(id, x, Yoldx,oldy) 函 数 实现 走 棋 规则 的 判断 。 

例如 “将 ”或 “是 ”的 走 棋 规则 ;只 能 走 一 格 ， 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 不 
能 大 于 1， 原 y 坐标 与 新 位 置 y 坐标 之 差 不 能 大 于 1。 


if (abs (X-O1Ldx) >1 or abs (y-oldy) >1) : 


return False; 


由 于 不 能 走出 九宫 , 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9 (因为 走 棋 时 自己 的 “将 ” 
或 “是 ”只 能 在 九宫 中 )， 否 则 此 步 违 规 ， 将 返回 False。 
if(x<3 or xX>5 Or (vy>=3 and yY<=6)) : 
return False; 


最 终 “ 将 ”或 “是 ”的 走 棋 规则 如 下 : 
#“ 将 ”或 “ 帅 ” 的 走 棋 判断 


if (qi name==" 将 " or qi name==" 帅 "): 
if ( (x-oldx)*(y-oldy) !=0): # 斜 线 走 棋 
return False; 
if (abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
1f lx<3 or X>5 Or (v=3 and v<=06})): 
return False; 


return Trues 


“ 仕 ” 或 “ 士 ” 的 走 棋 规 则 ; 只 能 走 斜 线 一 格 ， 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 为 1， 
日 原 y 坐标 与 新 位 置 y 坐标 之 差 也 为 1。 
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if(qi name==" 士 " or qi name==" 仕 ") : 
if((x-oldx)*(y-oldy)==0): 
return False; 
1i1f (abs (x-oldx)>1 or abs(y-oldy)>1): 


rein ee 


由 于 不 能 走出 九宫， 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9， 否 则 此 步 违 规 ， 将 返 
回 False。 


if(xX<3 Or X>5 Or (y>=3 and v<=6)): 


return False; 


“ 炮 ” 的 走 棋 规则 : 只 能 走 直 线 ， 所 以 x 和 yy 不 能 同时 改变 ， 即 (x 一 oldx) * (y 一 oldy) = 
0 保证 走 直 线 。 然 后 判断 如 果 x 坐标 改变 了 ， 原 位 置 oldx 到 目标 位 置 x 之 间 是 人 否 有 棋子 ， 
如 果 有 ， 则 累加 之 间 棋 的 个 数 ce。 通过 c 是 否 为 1 且 目 标 处 非 己 方 棋子 ， 可 以 判断 是 否 可 
以 走 棋 。 同 样 的 方法 判断 “ 炮 ” 的 y 坐标 改变 时 是 否 可 以 走 棋 。 

“ 兵 ” 或 “从 ”的 走 棋 规则 ;只 能 同 前 走 一 步 ， 根 据 是 否 过 河 检 查 是 否 横 走 ， 所 以 x 
与 原 坐 标 oldx 改变 的 值 不 能 大 于 1， 同 时 y 与 原 坐标 oldy 改变 的 值 也 不 能 大 于 1。 例 如 红 
兵 如 果 过 河 即 是 y<5 (游戏 时 红 方 在 南 )。 

#“ 座 ”或 “ 兵 ” 的 走 棋 判 断 


LEIdi nm = Mane = ny # 红 方 在 南 ， 黑 方 在 北 
if((x-oldx) * (y-oldy) !=0): # 不 是 直线 走 棋 
return False; 
if (abs (x-oldx) >1 or abs(y-oldy)>1): # 走 多 步 ， 不 符合 兵 仅 能 走 一 步 


return False; 
f(yS—5 and (x oldx} =0 and ql name——""]: 
# 红 兵 未 过 河 且 横向 走 棋 
return False; 
if(y<5 and (x-oldx) !=0 and qi name==" 兴 ") : # 黑 从 未 过 河 且 横向 走 棋 


return False; 


if(y-oldy>0 and qi name==" 兵 "): # 兵 后 退 
return False; 
iFlv OlGdv<0 and dl name "3"): # 众 后退 


return False; 
return True; 


其 余 棋子 的 判断 方法 类 似 ， 这 里 不 再 一 一 介绍 。 

@ 坐标 的 转换 

整个 棋盘 左上 和 角 的 坐标 为 (0.0)， 右 下 角 的 坐标 为 (8.9)， 如 图 15-4 所 示 。 例 如 “黑车 ” 
的 初始 位 置 即 为 (0,0),“ 黑 将 ”的 初始 位 置 即 为 (4,0),“ 红 是 ”的 初始 位 置 即 为 (4,9)。 在 走 
棋 过 程 中 ， 需 要 将 鼠标 像素 坐标 转换 成 棋盘 坐标 ， 棋 盘 方 格 的 大 小 是 76 像素 ， 通 过 整除 
76 解析 出 棋盘 坐标 (x,y)。 


x= (event x14)//16 # 换 算 成 棋盘 坐标 
y= (event.y-14)//76 
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《0.0) 


《0.3) 


图 15-4 棋盘 坐标 示意 图 


15.4 ”中 国 象棋 实现 的 步 又 


首先 导入 tkinter 库 。 视频 讲解 


from tkinter import * 


from tkinter.messagebox import * 


创建 一 个 Canvas， 设 置 其 背景 色 为 白色 ， 用 Canvas 显示 棋盘 中 所 有 的 棋子 。imgs 是 
PhotoImage 对 象 列表 ， 获 取 所 有 的 棋子 图 片 。 


dict ChessName={} # 定 义 一 个 字典 

例如 ， 本 游戏 中 字典 dict ChessName 存储 的 内 容 如 下 : 

{2: ' 黑 车 ', 3: ' 黑 马 ', 4: ' 黑 象 , 9: ' 黑 士 ', 6: ' 黑 将 ', 7: ' 黑 士 ', 8: ' 黑 象 ', 9: ' 黑 马 ', 10: ' 黑 车 ', 11: 
' 黑 玲 ', 12: ' 黑 从, 13: ' 黑 从 ', 14: ' 黑 浴 ', 15: ' 黑 从 ', 16: ' 黑 炮 ', 17: ' 黑 炮 ', 18: ' 红 车 ', 19: ' 红 马 ', 


20: ' 红 相 ', 21: ' 红 仕 ', 22: ' 红 帅 ', 23: ' 红 仕 ', 24: ' 红 相 ', 25: ' 红 马 ', 26: ' 红 车 ', 27: ' 红 兵 ', 28: ' 红 兵 
' 29: ' 红 兵 , 30: ' 红 兵 ' 31: ' 红 兵 ', 32: ' 红 炮 ', 33: ' 红 炮 '} 

字典 的 Key 为 每 个 棋子 图 像 的 ia，Value 是 棋子 种 类 名 ,例如 图 像 对 象 11 对 应 的 是 黑 
从 。 因 为 首先 建立 Canvas 对 象 id=0 和 棋盘 对 象 1d=1， 所 以 棋子 图 像 的 1d 是 从 2 开始 的 。 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

CVv=Canvas (root, bg="'white', width=720, height=800) 

chessname=[" 轩 守 "" 轩 马 "" 半 轨 "办 十 " 民 特 "十 归 和 

es 4 lk 4 Bp ep 

" 红 兵 "，" 红 炮 "] 
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从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


imgs=[PhotoImage (file='bmp\\'+chessname[i]+"' .png')for i In range(0,22)] 


chessmap=[[-1,-1,-1,-1,-1,-1,-1,-1,-1,-l1]for y in range(10)] 


dict ChessName={} # 定 义 一 个 字典 

LocalPplayer=" 红 " #LocalPlayer 记录 自己 是 红 方 还 是 黑 方 
First Tene # 区 分 是 第 1 次 还 是 第 2 次 选中 的 棋子 
ISMyEarn Frue 

rectl1=0 

rect2=0 


Fireatehessdd 


程序 运行 时 ， 首 先 调用 DrawBoard0 和 LoadChess() 加 载 棋盘 图 片 和 棋子 到 Canvas 中 
LoadChess() 初 始 化 游戏 区 中 各 个 棋子 的 位 置 ， 红 方 在 南 ， 黑 方 在 北 ， 并 且 在 chessmap 列表 
中 按 坐 标记 录 每 个 模子 图 像 的 id; 然后 绑 定 Canvas 鼠标 事件 函数 callbackO0， 也 就 是 鼠标 
单 击 游戏 画面 时 的 处 理 冰 数 ， 在 此 函数 中 人 处理 游戏 的 走 棋 吃 子 过 程 。 


ijmgl=PhotoImage (file='bmp\\ 棋 盘 .png') 
def DrawBoard() : # 男 棋盘 
pl=cv.create image((0,0),image=imgl) 
EvaCOO0rds(Dl (00400)) 
def LoadChess () : # 加 载 棋子 
global chessmap 
# 黑 方 16 个 棋子 
for 1 in Frange(0,9) : 
#" 辕 车" "黑马 "" 黑 稼 " "黑人 慎 "," 黑 将 "," 黑 仕 "," 辕 象 " "黑马 " "黑车 " 
img=imgs [1] 
id=cv.create image((60+76*i,54)，,image=img) ”#76x76 棋盘 格子 大 小 


dict ChessName[id]=chessname[1]; # 图 像 对 应 的 是 哪 种 棋子 
chessmap[i] [0]=id # 图 像 id 
for i in range(0,5): #5 个 举 
img=imgs [9] # 从 图 像 
id=cv.create image( (60+76*2*],54+3*76) ,1image=1mg) 
#76x76 棋盘 格子 大 小 
chessmap[i*2] [3]=id 
dict ChessName [id]=” 黑 洽 "; # 图 像 对 应 的 是 哪 种 棋子 
img=imgs [10] # 黑 方 炮 


lid=cVv.create image((60+76*],54+2*76),1image=1img) #76x76 棋盘 格子 大 小 
chessmap[1] [2]=id 

dict ChessName[id]=" 黑 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
id=cv.create image((60+76*7,54+2*76)，,image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [2]=id 

dict ChessName[id]=" 黑 炮 "; # 图 像 对 应 的 是 哪 种 棋子 

# 红 方 16 个 棋子 

for 1 in range(0,9): 


#" 红 车 "， "Tw " 红 相 " ， "Li" "hh" "A" nm 红 相 m”， 了 " 红 车 " 
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img=imgs [i+111] 
id=cv.create image( (60+76*1,54+9*76) ,image=img) #76x76 棋盘 格子 大 小 


dict chessName [id]=chessname[i+11]; # 图 像 对 应 的 是 哪 种 棋子 
chessmap[i] [9]=id # 图 像 id 
for 1 in range(0, 5 : #5 个 兵 
img=imgs [20] # 兵 图 像 
ld=cv.create image( (60+76*2*1,54+6*76) , Image=Img) #76x76 棋盘 格子 大 小 
chessmap [i*2] [6]=id # 图 像 id 
dict ChessName[id]=chessname[20]; # 图 像 对 应 的 是 哪 种 棋子 
img=imgs [21] # 红 方 炮 


idq=cv.create image((60+76*1,54+7*76)， image=img) #76x76 棋盘 格子 大 小 
chessmap[1] [7]=id 

dict ChessName [id]=" 红 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
idq=cv.create image((60+76*7,54+7*76)，,image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [7]=1d 


dict chessName [id]=" 红 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
= 
DrawBoard () # 男 棋盘 
LoadChess () # 加 载 棋 子 
# 


print (dict ChessName) 

cv Dindi"<BIltton 1 CallDaer) 

Cv.pack'() 

lablel=Label (root，fgq='red'!，bgq='white'，text=" 红 方 先 走 ") “# 提 示 信 息 标签 
TabTelTriext 可 三 wm 红 方 先生 1 

lablel .pack () 

root .mainloop () 


游戏 区 的 单 击 事件 处 理 用 户 走 棋 过 程 。 在 用 户 走 棋 时 ， 痛 先 要 选中 目 己 的 棋子 (第 1 
次 选择 棋子 )， 所 以 有 必要 判断 是 否 单 击 成 对 方 棋子 了 。 如 果 是 自己 的 棋子 ， 则 firstChessid 
记录 用 户 选 择 的 棋子 ， 同 时 棋子 被 加 上 红色 框 线 示意 被 选 中 。 

当 用 户 选 过 己方 棋子 后 ， 单 击 对 方 棋子 (secondChessid 记录 用 户 第 2 次 选择 的 棋子 ， 
被 加 上 黄色 框 线 )， 则 是 吃 子 ， 如 果 将 或 帅 被 吃 挥 ， 则 游戏 结束 。 当 然 ， 第 2 次 选择 棋子 有 
可 能 是 用 户 改 变 主意 , 选择 目 己 的 男 一 棋子 , 则 firstChessid 重新 记录 用 户 选择 的 己方 棋子 。 

当 用 户 选 过 己方 棋子 后 ， 在 单 击 的 位 置 无 棋子 ， 则 处 理 没有 吃 子 的 走 棋 过 程 。 调 用 
IsAbleToPut(CurSelect, x, y) 判 断 是 否 能 走 棋 , 如 果 符 合 走 棋 规 则 , 移动 棋子 , 修改 chessmap 
记录 的 棋子 信息 。 

ED # 走 棋 picBoard MouseClick 

global LocalPlayer 

global chessmap 

ee eh EeeE> # 选 中 框图 像 id 
global firstChessid,secondChessid 
JlobDal wl XZ YL YZ 

global first 


print ("clicked at", event.x, event.y, LocalPlayer) 
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x= (event .x-14)//76 # 换 算 棋盘 坐标 
y= (event.y-14)//76 
print ("clicked at", x, y, LocalPlayer) 


re # 第 1 次 单 击 棋子 
xXxl1=x; 
Vl=y; 
firstChessid=chessmap[xl1] [yl1] 
if not(chessmap[x1] [y1]==-1):  # 此 位 置 不 空 有 棋子 
player=dict ChessName [firstChessid] [0] 
# 获 取 单 击 棋子 的 颜色 ， 例 如 “ 红 马 ” 取 红 


if (player!=LocalPlayer): # 颜 色 不 同 
print (" 单 击 成 对 方 棋子 了 !"); 
ern 


print ("第 1 次 单 击 ", firstCchessigq) 
first=False; 
rectEl ev Create rectangle(lo0r orxz 40 A dty* /0 3 
60+76*x+80-40, 54+y*76+80-38,outline="red") ， # 男 选中 标记 框 
Ese # 第 2 次 单 击 
X2=Xx;? 
y2=Yy;? 
secondChessid=chessmap [x2] [y2] 
# 目 标 处 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
if not (chessmap [x2] [y2]==-1): # 此 位 置 不 空 ， 有 棋子 
player=dict ChessName[secondchessiqd] [0] # 获 取 单 击 棋子 的 颜色 
if (player==LocalPlayer): # 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
firstChessid=chessmap[x2] [y2] 
print ("第 2 次 单 击 " ,firstCchessid) 
cv-deletel(rectl); # 取 消 上 次 选择 的 棋子 标记 框 
Xl1=x; 
yl=y? 
# 设 置 选 择 的 棋子 颜色 
ectel CV erenterrectangleloUr GD S419 30 
60+76*x+80-40, 54+y*76+80-38,outline="red") ”# 画 选中 标记 框 
print{" 第 2 次 蛙 击 "firstChesslid) 
return; 
else: # 在 落 子 目标 处 画 框 
PrectZ Cv Create rectanglelo0 rt (ox 0 wsTY 本 = 
60+76*x+80-40, 54+y*76+80-38, outline="yellow") # 目 标 处 画 框 
# 目 标 处 没 棋子 ， 移 动 棋子 
print("kkkkk "EiratChessidy 
if (chessmap [x2] [y2]==" " or chessmap [X2] [y2]==-1): 
# 目 标 处 没 棋 子 ， 移 动 棋子 
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print ("目标 处 没 棋子 ， 移 动 棋子 "，, firstchessid, x2, y2,xl,y1) 

if (IsAbleToPut (firstChessid, x2,y2,xl,y1l)): # 判 断 是 否 可 以 走 棋 
print ("can 移动 棋子 " ,x1, y1) 
cv.move (firstChessid,76*(x2-x1),76*(y2-yl1)); 


非 米 来 来 来 来 求 求 求 求 求 求 求 来 求 求 求 求 求 来 来 求 来 求 来 来 来 求 求 来 求 来 求 来 来 玉 玉 来 来 来 来 玉 束 来 来 求 求 求 求 求 炒 求 求 求 


# 在 map 中 取 掉 原 棋子 
chessmap[xl1] [yl1]=-1; 


chessmap[x2] [y2]=firstChessid 
cv.delete (rect1) ; # 删 除 选 中 标记 框 
EV UletE(reCt2y: # 删 除 目标 标记 框 
非 来 来 来 来 求 求 求 求 求 求 求 求 来 求 求 来 求 求 来 来 求 求 求 来 来 来 来 来 来 求 来 求 来 来 来 求 求 求 来 来 求 求 求 来 求 求 求 求 求 求 求 求 求 
first=True; 
SetMyTurn (False); # 该 对 方 了 
else: 
# 错 误 走 棋 
print ("不 符合 走 棋 规则 ") ; 
showinfo (title=" 提 示 ",message=" 不 符合 走 棋 规则 ") 
return; 
else: 
# 目 标 处 有 棋子 ， 可 以 吃 子 
if (not (chessmap [X2] [y2]==-1) and IsAbleToPut (firstChessid,x2, 
v2 x yl) # 可 以 吃 子 
first=True; 
Dernt team yl) 
cv.move (firstChessid,76*(x2—-x1),76*(y2-y1)); 
非 六 六 六 六 六 六 六 六 六 六 六 六 玉米 闵 六 六 六 玉米 六 六 六 六 玉米 六 玉米 闵 六 玉米 玉米 闵 闵 闵 闵 六 玉米 闵 闵 闵 闵 闵 六 六 玉米 闵 冰 
# 在 map 中 取 掉 原 棋子 
chessmap [xl1] [yl1]=-1; 
chessmap [x2] [y2]=firstChessid 
cv.delete (secondChessid); 
cv.delete (rectl]1); 
cv.delete (rect2); 
非洲 米 六 玉米 六 玉米 六 六 六 六 六 六 六 玉米 闵 六 六 六 玉米 六 玉米 六 玉米 米 闵 玉米 闵 米 闵 玉米 洲 闵 米 闵 六 玉米 玉米 六 玉 六 六 六 闵 
if(dict ChessName [secondChessid] [1]==" 将 ") : 捍 " 将 " 
showinfo (title=" 提 示 ",message=" 红 方 你 赢 了 ") 
return; 
if(dict ChessName[secondChessid] [1]==" 帅 "): = 
showinfo (tit1le=" 提 示 " ,message=" 黑 方 你 赢 了 ") 


return; 
#send 
SetMyTurn (False); # 访 对方 了 
else: # 不 能 吃 子 


print ("不 能 吃 子 "); 
1 | 7 i 
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cv.delete (rect2) ; # 删 除 目 标 标记 框 


SetMyTurO 设 置 该 哪 方 走 棋 ，LocalPlayer 记录 轮 到 哪 方 走 棋 ， 并 在 标签 上 显示 提示 
信息 。 


def SetMyTurn (flag): 
global LocalPlayer 
IsMyTurn=flag 
if LocalPlayer==" 红 " : 
ee A 
lablel['text']=" 轮 到 黑 方 走 " 
else: 
TO TI 
lablel['text']=" 轮 到 红 方 走 " 


def IsAbleIToPut(idx.yoldx,oldV) 实 现 判断 是 否 能 走 模 并 返回 逻辑 值 ， 其 代码 较 复 杂 。 


def IsAbleToPut (id, x, y, oldx, oldy): 
#oldx，oldy 棋子 在 棋盘 的 原 坐 标 
#x, Y 棋子 移动 到 棋盘 的 新 坐标 
qi name=dict ChessName [id] [1] 
# 取 字符 串 中 的 第 2 个 字符 ， 例 如 “ 黑 将 ”中 的 “将 ”， 从 而 得 到 棋子 类 型 
#“ 将 ”或 “ 帅 ” 的 走 棋 判断 
EU mn 
if((x-oldx)*(y-oldy) !=0): 
return False; 
1f (abs (x-oldx) >1 or abs (y-oldy)>1): 
return False; 
1f (x<3 Or X25 Or (v2=3 and v<=0))- 
return False; 
return True; 
#“ 仕 ”或 “ 士 ” 的 走 棋 判 断 
if (qi name=="I" OF qi name==" 仕 ") : 
if( (x-oldx)*(y-oldy)==0): 
return False; 
1f (abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
if (x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
return True; 
#“ 象 ”或 “ 相 ” 的 走 棋 判断 
Tn me 
if((x-oldx)*(y-oldy)==0): 
return False; 
if (abs (x-oldx) !=2 or abs (y-oldy) !=2) : 


return False-: 
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if(y<5 and qi name==" 相 ") : 


return False; 


if(y>=5 and qi name==" 家 ") : 
return False; 

1=0; J=0; 

If I Oldr 2 
1=x—1; 

if (x-oldx==-2): 
1=Xx+1; 

if (y-oldy==2): 
JY Ls 

if (y-oldy==-2): 
J]=y+1; 


if (chessmap[i][]j]]!'=-1): 
return False; 
return True; 
#" 马 "的 走 棋 判断 


if (qi name==" 马 ") : 


1f (abs (X-oldx)*abs (y-oldy) !=2) : 


return False; 
iFIlxs Oldx =—2)2 


if (chessmap[x-1] [oldy] !=-1) : 


return False; 
if (x-oldx==-2): 


if (chessmap[x+1] [oldy] !=-1) : 


return False; 
i1f (y-oldy==2): 


if (chessmap[oldx] [y-1]!=-1) : 


return False; 
if (y-oldy==-2): 


if (chessmap[oldx] [y+1] !=-1): 


return False; 
return True; 
#“ 车 ”的 走 棋 判断 
if (qi name==" 丰 "): 
# 判 断 是 否 为 直线 
i1f( (x-oldx)*(y-oldy) !=0) : 
return False; 
# 判 断 是 否 隔 有 棋子 
.Fix oldxys 
下 下 【加 加 六 > 
t=x; 
Xx=Oldx; 
Oldx=t; 


第 15 前 ”人 盘 智 游 戏 一 一 中 国 象 棋 1 S 


#i、j 必须 有 初始 值 


# 鉴 象 腿 


# 烙 马 腿 
# 烙 马 腿 
# 烙 马 腿 


# 烙 蕊 腿 
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for 1 in Frange (oO1dXx,X+1) : 
if(i!=x and 1i!=oldx): 
if(chessmap[i][y]!'=-1): 
return False; 
if (y!=oldy): 
i1f (oldvy>y): 
t=y; 
y=Ooldy; 
oldy=t; 
for ] in rangel(oldy,y+1): 
If(]!=y and J!=oldy): 
if (chessmap [X] []]!=-1) : 
return False; 
return True; 
#“ 炮 ”的 走 棋 判断 
Er 
swapflagx=False; 
swapflagy=False; 
if( (x-oldx)*(y-oldy) !=0) : 
return False; 
C=0 7 
LE 
EtoldxS rl 
寺 % = 
x=Oldx; 
oldx=t; 


swapf lagx=True; 


for 1 In range (oldx,x+1): #for (i=oldx; 1<=x; 1+=1): 


TE sn 
if (chessmapl[lil][y]!'=-1): 
C=C+1; 
if (y!=oldy): 
1f(0ldyS>v}): 

En 

y=Ooldy; 

oldy=t; 

swapflagy=True; 


for ] in range(oldy,y+1): #for(]J]=oldy; J<=y; J+=1): 


If(]!=y and JjJ!=oldy): 
if(chessmap[x] []]!=-1) : 
C=C+1; 
下 Ti 


return False; # 与 目标 处 间 隐 1 个 以 上 的 棋子 
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if (c=—0): # 与 目标 处 无 间隔 棋子 
1f (swapflagx==True): 
t=x; 
x=Oldx; 
oldx=t; 
if (swapflagy==True): 
Ey 
y=oldy; 
oldy=t; 
if (chessmap[x] [y] !=-1) : 
return False; 
aE c== 1 # 与 目标 处 间隔 1 个 棋子 
1f (swapflagx==True): 
t=x; 
Xx=Oldx; 
oldx=t; 
1f (swapflagy==True): 
Es 
y=Oldy; 
oldy=t; 
if (chessmap[x] [y]==-1): # 如 果 目 标 处 无 棋子 ， 则 不 能 走 此 步 
return False; 
return True; 
#“ 众 ”或 “ 兵 ” 的 走 棋 判断 
oe 下 区 人生 古人 和 站 二 而 已 三 王 寺 二。 
if((x-oldx)*(y-oldy) !=0) : # 不 是 直线 走 棋 
return False; 
1if (abs (x-oldx)>1 or abs (y-oldy)>1): 
# 走 多 步 ， 不 符合 兵 只 能 走 一 步 
return False; 
if(y>=5 and (x-oldx) !=0 and qi name==" 兵 "): 
# 未 过 河 且 横 回 走 棋 
return False; 
if(y<5 and (x-oldx) !=0 and qi name==" 共 ") : 


# 未 过 河 且 横向 走 棋 
return False; 
if (y-oldy>0 and qi name==" 兵 "): # 后 退 
return False; 
if(y-oldy<0 and qi name==" 举 "): # 后 退 


return False:; 
TetEUrn Trues 


return True; 


其 运行 效果 如 图 15-5 和 图 15-6 所 示 。 这 个 游戏 ， 双 方 在 本 机 轮 下 ， 读 者 可 以 根据 网 
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从 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


络 五 子 棋 的 UDP 通信 知识 完善 本 游戏 ， 从 而 实现 网 络 版 中 国 象棋 。 


图 15-6 中 国 象 棋 运 行 界面 
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16.1 人 物 拼图 游戏 介绍 


拼图 游戏 将 一 幅 图 片 分 割 成 若干 拼 块 ， 并 将 它们 随机 打 乱 顺序 ， 当 将 ”区 喀 攻 祝 
所 有 拼 块 都 放 回 原 位 置 时 就 完成 了 拼图 (游戏 结束 )。 机 

本 人 物 拼图 游戏 为 3 行 3 列 ， 拼 块 以 随机 顺序 排列 ， 玩 家 通过 用 鼠标 。 ”人 * 绕 红 解 
单 击 空白 块 四 周 来 交换 它们 的 位 置 ， 直 到 所 有 拼 块 都 回 到 原 位 置 。 拼 图 游戏 的 运行 界面 如 
16-1 所 示 。 


4 拼图-- 夏 敏捷 2017-10-5 
步 数 :1 


图 16-1 拼图 游戏 的 运行 界面 


| 
从 入 门 到 实战 一 一 假 虫 、 游 戏 和 机 器 学 习 


16.2 程序 设计 的 思路 


游戏 程序 自 先 将 图 片 分 割 成 相应 的 3 行 3 列 的 拼 块 ， 并 按 顺 序 编写， 动态 生成 一 个 大 
小 为 3x3 的 列表 board， 存 放 0 一 8 的 数 ， 每 个 数字 代表 一 个 拼 块 〈 例 如 3x3 的 游戏 拼 块 的 
编写 如 图 16-2 所 示 )， 其 中 8 号 拼 块 不 显示 。 


图 16-2 拼 块 编写 示意 图 
游戏 开始 时 ， 随 机 打 乱 数组 board,， 例如 board[0][0] 是 5 号 拼 块 ， 则 在 左上 角 显 示 编 号 
是 5 的 拼 块 。 根据 玩家 用 鼠标 单 击 的 拼 块 和 空白 块 所 在 位 置 来 交换 board 数组 对 应 的 元 素 ， 
最 后 通过 判断 元 素 的 排列 顺序 来 判断 是 否 已 经 完成 游戏 。 


16.3 ”关键 技术 
16.3.1 复制 和 粘贴 图 像 区 域 


使 用 crop0 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 例 如 : 

from PIL import Image 

im=Image.open("D:\\test.jpg") 

box= (100,100,400, 400) 

reglion=im.crop (box) 

该 区 域 使 用 四 元 组 来 指定 。 四 元 组 的 坐标 是 ( 左 , 上 , 右 , 下 )。 在 PIL 中 指定 坐标 系 的 左上 
角 坐 标 为 (0.0)。 用 户 可 以 旋转 上 面 代码 获取 的 区 域 ， 然 后 使 用 paste0) 方 法 将 该 区 域 放 回去 ， 
具体 实现 如 下 : 

region=region.transpose (Image .ROTATE 180) # 逆 时 针 旋 转 180° 

im.paste (region, box) 


16.3.2 ”调整 尺寸 和 旗 转 


如 果 要 调整 一 幅 图 像 的 尺寸 ， 可 以 调用 resize() 方 法 。 该 方法 的 参数 是 一 个 元 组 ， 用 来 
指定 新 图 像 的 大 小 : 


out=im.resize((128,128)) 
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如 条 要 旋转 一 幅 图 像 ， 可 以 使 用 逆 时 针 方式 表示 旋转 角度 ， 然 后 调用 rotate(0) 方 法 : 
out=im.rotate (45) # 逆 时 针 旋 转 45° 


16.3.3 ”转换 成 灰 度 图 像 


对 于 彩色 图 像 ， 不 管 其 图 像 格 式 是 PNG、BMP 还 是 JPG， 在 PIL 中 使 用 Image 模块 
的 open0) 函 数 打 开 后 ， 返 回 的 图 像 对 象 的 模式 部 是 “RGB”。 对 于 灰 度 图 像 ， 不 管 其 图 像 格 
式 是 PNG、BMP 还 是 JPG， 打 开 后 模式 都 为 “L”。 

对 于 PNG、BMP 和 JPG 彩 色 图 像 格式 之 间 的 互相 转换 ,都 可 以 通过 Image 模 块 的 open() 
和 saveO 函 数 来 完成 。 有 具体 来 说 就 是 ， 在 打开 这 些 图 像 时 PIL 会 将 它们 解码 为 三 通道 的 
“RGB” 图 像 ， 用 户 可 以 基于 这 个 “RGB” 图 像 对 其 进行 处 理 ， 处 理 完毕 后 使 用 save( 〇 函数 
可 以 将 处 理 结果 保存 成 PNG、BMP 和 JPG 中 的 任何 格式 ， 这 样 也 就 完成 了 几 种 格式 之 间 
的 转换 。 当 然 ， 对 于 不 同 格式 的 灰 度 图 像 ， 也 可 以 通过 类 似 途 径 完成 ， 只 是 PIL 解码 后 是 
模式 为 “L” 的 图 像 。 

这 里 详细 介绍 一 下 Image 模块 的 convert() 函 数 ， 用 于 不 同 模 式 图 像 之 间 的 转换 。 

convert(0 函 数 有 3 种 形式 的 定义 ， 它 们 的 定义 形式 如 下 : 

im.convert (mode) 

im.convert ('P', **options) 

im.convert (mode, matrix) 

使 用 不 同 的 参数 ， 将 当前 的 图 像 转 换 为 新 的 模式 (在 PIL 中 有 9 种 不 同 模式 ， 分 别 为 
1、L、P、RGB、RGBA、CMYK、YCbCr、I、F)， 并 产生 新 的 图 像 作 为 返回 值 。 

例如 : 

from PIL import Image # 或 直接 ijmport Image 

im=Image.open('a.]Jpg') 

iml=im.convert ('L"') # 将 图 片 转换 成 灰 度 图 

“L” 模 式 的 图 像 为 灰色 图 像 ， 它 的 每 个 像素 用 8 个 bit 表示 ，0 表示 黑 ，255 表示 日 ， 
其 他 数字 表示 不 同 的 灰 度 。 在 PIL 中 ， 从 “RGB” 模 式 转 换 为 “L” 模 式 是 按照 下 面 的 公 
式 进行 的 : 

L=R*299/1000+G*587/1000+ B*114/1000 
打开 图 片 并 转换 成 灰 度 图 的 方法 如 下 : 


1Im=Imagqe.open('a.]jpg') .convert('L) 


如 果 转 换 成 黑白 图 像 (二 值 图 像 )， 也 就 是 模式 为 “1” 的 图 像 ( 非 黑 即 白 )， 它 的 每 
个 像素 用 8 个 bit 表示 ，0 表示 黑 ，255 表示 白 。 下 面 将 彩色 图 像 转 换 为 黑白 图 像 。 


from PIL import Image # 或 直接 import Image 
im=Image.open('a.jJpg') 


m=im Coverel* 1") # 将 彩色 图 像 转换 成 黑白 图 像 
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16.3.4 ”对 像素 进行 操作 


getpixel(x.y) 用 于 获取 指定 像素 的 颜色 ， 如 果 图 像 为 多 通道 ， 则 返回 一 个 元 组 。 该 方法 
的 执行 比较 慢 ， 如 果 用 户 需 要 使 用 Python 处 理 图 像 中 的 较 大 部 分 数据 ， 可 以 使 用 像素 访问 
对 象 (load0 或 者 getdata() 方 法 )。putpixel(xy,color) 可 以 改变 单个 像素 点 的 颜色 。 


img=Image .open ("smallimg .png") 


img .getpixel ((4,4)) # 获 取 像 素 的 颜色 
img .putpixel((4,4), (255,0,0)) # 改 变 单个 像素 点 为 红色 


img.save ("imgl .png", "png") 


说 明 : getpixel0 得 到 图 片 img 的 坐标 为 (4,4) 的 像素 点 ，putpixel0 将 坐标 为 (4,4) 的 像素 
点 变 为 (255,0,0) 的 颜色 ， 即 红色 。 


16.4 ”程序 设计 的 步 又 


16.4.1 ”Python 处 理 图 片 切 割 


使 用 PIL 库 的 Image 模块 中 的 crop(0 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 该 区 域 使 
用 四 元 组 来 指定 , 四 元 组 的 坐标 是 ( 左 ,上 , 右 ,下 )。 在 PIL 中 指定 坐标 系 的 左上 角 坐 标 为 (0.0)。 
其 具体 实现 如 下 : 

from PIL import Image 

img=Image .open (r'C:\woman.]jJpg') 

box= (100,100,400, 400) 


reglion=img .crop (box) # 裁 切 图 片 
# 保 存 裁 切 后 的 图 片 


region.save('crop.jJpg') 


在 本 游戏 中 需要 把 图 片 分 割 成 3 行 X3 列 的 图 片 块 ， 在 上 面 的 基础 上 指定 不 同 的 区 域 
即 可 裁剪 、 保 存 。 为 了 更 通用 一 些 ， 编 成 splitimasge(srcTrownum,colnum.,dstpatb) 函 数 ， 实 现 
将 指定 的 src 图 片 文件 分 割 成 rownumxcolnum 数量 的 小 图 片 块 。 其 具体 实现 如 下 : 


import os 
from PIL import Image 
def splitimage (src, rownum, colnum, dstpatnh): 
img=Image.open (src) 
w, h=img.size # 图 片 大 小 
if rownum<=h and colnum<=w: 
print ('Original image info: %sx%5s, $s, $5' $ (w, h, img.format, 


img .mode)) 
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print (' 开 始 处 理 图 片 切割 ， 请 稍 候 …") 
s=0s .path.split (src) 


if dstpath=="": # 没 有 输入 路 径 
dstpath=s [0] # 使 用 源 图 片 所 在 目录 s [0] 

Fo ST1l Ti Ee #s [1] 是 源 图 片 文 件 名 

basename=fn [0] # 主 文件 名 

ext=fn[-1] # 扩 展 名 

num=0 

rowheight = h #rownum 

colwidth = w #colnum 


for r in range (Ownum) : 
for c in range (colnum): 
box=(c*colwidth, r*rowheight, (c+l1)*colwidth, (r+1)*rowheight) 
img.crop (box) .save (os .path.jJoin(dstpath, basename+' ' + 
str (num)+"' .'"'+ext)) 
num=num+1 
print (' 图 片 切割 完毕 ， 共 生成 ss 张 小 图 片 。' % num) 
else: 
print (' 不 合法 的 行列 切割 参数 !') 
src=input (' 请 输入 图 片 文 件 路 径 : ') 
#src="C:\woman .png" 
if os.path.1isfile (src): 
dstpath=input (' 请 输入 图 片 输出 目录 (不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): ') 
if (dstpath=='') or os.path.exists (dstpath): 
row=int (Input (' 请 输入 切割 行 数 : ') ) 
col=int (input (' 请 输入 切割 列 数 : ' ) ) 
TF FouwS0 and col>0- 
splitimage (src, row, col, dstpath) 
else: 
print (' 无 效 的 行列 切割 参数 ! ') 
else: 
print (' 图 片 输出 目录 $s 不 存在 ! ' % dstpath) 
else: 


print (' 图 片 文件 $s 不 存在 ! ' % src) 
运行 结果 如 下 : 


请 输入 图 片 文 件 路 径 : C:\woman .png 

请 输入 图 片 输出 目录 〈 不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): 
请 输入 切割 行 数 : 3 

请 输入 切割 列 数 : 3 

Original image info: 283x212, PNG, RGBA 
开始 处 理 图 片 切割 ， 请 稍 候 … 

图 片 切割 完毕 ， 共 生成 9 张 小 图 片 。 
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16.4.2 ”游戏 的 远 辑 实现 


@ 定义 常量 及 加 载 图 片 
from tkinter import * 
from tkinter.messagebox import * 
import random 
# 定 义 常 量 
# 画布 的 尺 二 
WIDTH=312 
HEIGHT=450 
# 图 像 块 的 边 长 
IMAGE WIDTH=WIDTH // 3 
IMAGE HEIGHT=HEIGHT // 3 
# 游 戏 的 行 / 列 数 
ROWS=3 
COLS=3 
# 移 动 步 数 
steps=0 
# 保 存 所 有 图 像 块 的 列表 
BOaTO bl ot Al 
[3, 4, >], 
Lo ji 
root=Tk(' 拼 图 2017') 
root .title ("拼图 -- 夏 敏捷 2017-10-5") 
# 载 入 外 部 事先 生成 的 9 个 小 图 像 块 
PYCs=—[] 
for 1 in range (9): 
filename="woman "+str (i)+".png" 


Pics.append (PhotoImage (file=filename)) 


全 图 像 块 类 


每 个 图 像 块 ( 拼 块 ) 是 一 个 Square 对 象 , 具有 draw 功能 ,即将 本 拼 块 图 片 绘制 到 Canvas 


orderID 属性 是 每 个 图 像 块 〈 拼 块 ) 对 应 的 编号 。 
# 图 像 块 〈 拼 块 ) 类 


Class Square : 
def 下 (self, orderID): 
self .orderID=orderID 
def draw(self, canvas, board pos): 


img=Pics[self.orderID] 


canvas.create image (board pos, image=1img) 


全 初始 化 游戏 


random.shuffle(board) 打 乱 二 维 列表 只 能 按 行进 行 ， 所 以 使 用 一 维 列表 来 实现 编号 的 打 
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乱 。 在 打 乱 图 像 块 后 ， 根 据 编 号 生成 对 应 的 图 像 块 〈 拼 块 ) 到 board 列表 中 。 


def init board(})™: 
# 打 乱 图 像 块 
L=1ist(range (9) ) 3 州 家 11071203 A576.7 8] 
random.shuffle (L) 
# 填 充 拼 图 板 
for 1 in range (ROWS): 
for ] in range (COLS) : 
1dx=1*ROWS+] 
orderID=L[idx] 
If orderID 1s 8: #8 号 拼 块 不 显示 ， 所 以 存 为 None 
board[1I] []]=None 
else: 


board[1] []]=Sdquare (orderID) 
@@ 绘制 游戏 界面 中 的 各 元 素 
def drawBoard (canvas): 


# 画 黑 框 
canvas.create polygon((0, 0, WIDTH, 0, WIDTH, HEIGHT, 0, HEIGHT), 
width=1,outline='Black'"') 
# 画 所 有 图 像 块 
for 1 in range (ROWS): 
for ] in range (COLS): 
if boardq[1][]] is not None: 
board[1] []] .draw(canvas, (IMAGE WIDTH* (J+0.5),IMAGE 
HEIGHT* (1i1+0.5))) 


全 鼠标 事件 
将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 ， 如 果 单 击 空 位 置 ， 什 么 也 不 移动 ， 否 则 依次 
检查 被 单 击 当 前 图 像 块 的 上 、 下 、 左 、 右 是 个 有 空位 置 ， 如 果 有 ， 融 移动 当前 图 像 块 。 


def mouseclick (pos): 
global steps 
# 将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 
r=int (pos.y // IMAGE HEIGHT) 
c=int (pos.x // IMAGE WIDTH) 


if r<3andc«<3: # 单 击 位 置 在 拼图 板 内 才 移动 图 片 
if board[r] [c] is None: # 单 击 空 位 置 ， 什 么 也 不 移动 
return 
else: 


# 依 次 检查 被 单 击 当 前 图 像 块 的 上 、 下 、 左 、 右 是 否 有 空位 置 ， 如 果 有 ， 就 移动 当前 图 像 块 
current square Doardlriicl 


1 nd Doardlr IIIcel 1 None. # 淹 册 r 上 [而 
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boardl[lrl] [cl=None 
boardlr ijlcl current square 
steps+=1]1 

elif c+1<=2 and board[r] [c+1] is None:  # 判 断 右面 
boardl[rl] [Tc]l=None 
boardl[r] [c+l1]=current Square 
steps+=1 

elif r+1<=2 and board[r+1] [c] is None: 半 判 断 下 面 
board[T] [cl|=None 
board[r+l1] [cl=current Square 
steps+=1 

elif c-1>=0 and board[r][c-1] is None:  # 判 断 左 面 
boardl[lrl] [cl]=None 
board[r]|[c-l1]=current Square 
steps+=1] 

#print (board) 

labelll["text"l] =" 步 数 ; "+str (steps) 

cu deleEel"dll") # 清 除 画 布 上 的 内 容 

drawBoard (cv) 

fF wintl= 


showinfo (tit1le=" 恭 喜 ",message=" 你 成 功 了 ! ") 


@ 给 赢 的 判断 
判断 拼 块 的 编号 是 否 为 有 序 的 ， 如 果 不 是 有 序 的 ， 则 返回 False。 


def win(): 
for 1 In range (ROWS): 
for ] in range (COLS): 
If boardq[1][]] is not None and board[i][]] .orderID!=1 * ROWS + ] : 
return False 


return True 


@ 重 置 游戏 


def Play game (): 
global steps 
steps=0 


i1n1t boardt{)} 
候 “重新 开始 ”按钮 的 单 击 事件 
def callBack2 () : 

print ("重新 开始 ") 


play game () 
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cv.delete('all') # 清 除 画 布 上 的 内 容 


drawBoard (cv) 


主 程 序 


# 设 置 窗口 

CVv=Canvas (root, bg="'green', width=WIDTH, height=HEIGHT) 
bl=Button (root, text=" 重 新 开始 ", command=callBack2,width=20) 
labell=Label (root, text=" 步 数 ; "+str (steps), fg="red",width=20) 
labell .pack () 

cv.bind("<Button-1>", mouseclick) 

cv .pack () 

Bipacel) 

play game () 

drawBoard (cv) 


root .mainloop() 


至 此 完成 人 物 拼图 游戏 设计 。 
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Pygame 最 初 由 Pete Shinners 开发 ， 它 是 一 个 路 平台 的 Python 模块 ， 专 为 电子 游戏 设 
计 ， 包含 图 像 、 声 音 功 能 和 网 络 文 持 ， 这 些 功能 使 开发 者 很 容易 用 Python 写 一 个 游戏 。 虽 
然 不 使 用 Pygame 也 可 以 写 一 个 游戏 , 但 如 果 能 充分 利用 Pygame 库 中 已 经 写 好 的 代码 , 开 
发 要 容易 得 多 。Pygame 能 把 游戏 设计 者 从 低级 语言 (例如 C 语言 ) 的 束缚 中 解放 出 来 ， 
专注 于 游戏 逻辑 本 号 。 

由 于 Pygame 很 容易 使 用 且 路 平台 , 所 以 在 游戏 开发 中 十 分 受 欢迎 。 因为 Pygame 是 开 


放 源 代码 的 软件 ， 也 促使 一 大 批 游戏 开 友 者 为 完善 和 增强 它 的 功能 而 努力 。 


17.1 Pygame 基础 知识 


17.1.1 ”安装 Pygame 库 站 人 


在 开发 Pygame 程序 之 前 , 需要 安装 Pygame 库 。 用 户 可 以 通过 Pygame。 国 帐 车 洁 时 
的 官方 网 站 “http://www.pygame.org/download.shtml” 下 载 源 文件 ， 安 装 指 视频 讲解 
导 也 可 以 在 相应 页 面 找到 。 

一 旦 安装 了 Pygame， 就 可 以 在 IDLE 交互 模式 中 输入 以 下 语句 检验 是 否 安装 成 功 : 


>>> import pygame 
>>> print (pygame .Ver) 
二 人 过 二 本 在 


1.9.2 是 Pygame 的 最 新 版 本 ， 读 者 也 可 以 找 一 找 其 他 更 新 的 版 本 。 


17.1.2 Pygame 的 模块 
Pygame 有 大 量 可 以 被 独立 使 用 的 模块 。 对 于 计算 机 的 常用 设备 , 都 有 对 应 的 模块 进行 
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控制 ， 另 外 还 有 其 他 一 些 模块 ， 例 如 pygame.display 是 显示 模块 、pygame.keyboard 是 键盘 
模块 、pygame.mouse 是 鼠标 模块 ， 如 表 17-1 所 示 。 


表 17-1 Pygame 软件 包 中 的 模块 


模 块 名 
pygame.cdrom 访问 光驱 
pygame.cursors 加 载 光 标 


pygame.display 访问 显示 设备 
pygame.draw 绘制 形状 、 线 和 扣 
pygame.event 管理 事件 
pygame.font 使 用 字体 
pygame.1mage 加 载 和 存储 图 片 
pygame.joystick 使 用 游戏 手柄 或 者 类 似 的 东西 
pygame.key 读 取 键盘 按键 
pygame.mixer 声音 
pygame.mouse 鼠标 
pygame.movie 播放 视频 
pygame.music 播放 音频 


pygame.overlay 


访问 高 级 视频 登 加 


pygame Python 模块 ， 专 为 电子 游戏 设计 
pygame.rect 管理 矩形 区 域 

pygame.sndarray 操作 声音 数据 

pygame.sprite 操作 移动 图 像 

pygame.surface 管理 图 像 和 屏幕 
pygame.surfarray 管理 点 阵 图 像 数据 

pygame.time 管理 时 间 和 帧 信息 
pygame.transform 缩放 和 移动 图 像 


建立 Pygame 项 目 和 建立 其 他 Python 项 目的 方法 一 样 ， 在 IDLE 或 文本 编辑 器 中 新 建 
一 个 空 文档 ， 需 要 告诉 Python 该 程序 用 到 了 Pygame 模块 。 

为 了 实现 此 目的 ， 这 里 使 用 一 个 import 指令 ， 该 指令 告诉 Python 载 入 外 部 模块 。 例 
如 输入 下 面 两 行 在 新 项 目 中 引入 必要 的 模块 : 


import pygame, sys, time, random 
from pygame.locals import * 


第 1 行 引 入 Pygame 的 主要 模块 、sys 模块 、time 模块 和 random 模块 。 

第 2 行 告 诉 Python 载 入 pygame.locals 的 所 有 指令 使 它们 成 为 原生 指令 ， 这 样 在 使 用 
这 些 指令 时 融 不 需要 用 全 名 调用 。 

由 于 人 硬件 和 游戏 的 兼容 性 或 者 请 求 的 驱动 没有 安装 的 问题 ， 有 些 模块 可 能 在 某 些 平台 
上 不 存在 ， 可 以 用 None 测试 一 下 。 例 如 测试 字体 是 否 载 入 : 


if pygame.font is None: 
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P,,., 项 目 案 例 开 发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


print ("The font module is not available!") 


pygame .quit () # 如 果 没 有 则 退出 Pygame 的 应 用 环境 


下 面 对 第 用 模块 进行 简要 说 明 。 
人 pygame.surface 
该 模块 中 有 一 个 surface() 函 数 ，surface() 函 数 的 一 般 格 式 如 下 : 


pygame .surface( (width, height), flags=0, depth=0, masks=none) 


它 返 回 一 个 新 的 surface 对 象 。 这 里 的 surface 对 象 是 一 个 有 确定 尺寸 的 空 图 像 ， 可 以 
用 它 进行 图 像 的 绘制 与 移动 。 

[2 pygame.locals 

在 pygame.locals 模块 中 定义 了 Pygame 环境 中 用 到 的 各 种 第 量 ， 而 且 包 括 事件 类 型 、 
按键 和 视频 模式 等 的 名 字 ， 在 导入 所 有 内 容 〈from pygame.locals import * ) 时 用 起 来 很 
安全 。 

如 条 用 户 知道 需要 的 内 容 ， 也 可 以 导入 有 具体 的 内 容 〈 例 如 from pygame.locals import 
FULLSCREEN )。 

@ pygame.display 

pygame.display 模块 包括 处 理 Pygame 显示 方式 的 函数 ,其 中 包括 普通 窗口 和 全 屏 模 式 。 

游戏 程序 通常 需要 下 面 的 函数 : 

1) flipO/update() 

(1) flip0: 更 新 显示 。 一 般 来 说 , 在 修改 当前 屏 磊 的 时 候 要 经 过 两 步 , 首先 需要 对 get_ 
surfaceO 函 数 返 回 的 surface 对 象 进行 修改 ， 然 后 调用 pygame.display.flipO0 更 新 显示 以 反映 
所 做 的 修改 。 

(2) update(): 在 只 想 更 新 屏幕 一 部 分 的 时 候 使 用 update0 函 数 ， 而 不 是 flip0 函 数 。 

2) set model() 

该 函数 建立 游戏 窗口 ， 返 回 surface 对 象 。 它 有 3 个 参数 ， 第 1 个 参数 是 元 组 ， 用 于 指 
定 窗 口 的 尺寸 ; 第 2 个 参数 是 标志 位 ， 具 体 含义 如 表 17-2 所 示 ， 例 如 FULLSCREEN 表示 
全 屏 ， 默 认 值 为 不 对 窗口 进行 设置 ， 读 者 可 根据 需要 选用 ， 第 3 个 参数 为 色 深 ， 用 于 指定 
窗口 的 色彩 位 数 。 

表 17-2 ”set_mode 的 窗口 标志 位 的 参数 取 值 


窗口 标志 位 功 能 
FULLSCREEN 创建 一 个 全 屏 窗 口 
DOUBLEBUF 创建 一 个 “ 双 绥 冲 ” 窗 口 ， 建 议 在 HWSURFACE 或 者 OPENGL 时 使 用 
HWSURFACE 创建 一 个 硬件 加 速 的 窗口 ， 必 须 和 FULLSCREESN 同时 使 用 
OPENGL 创建 一 个 OPENGL 演 染 的 窗口 
RESIZABLE 创建 一 个 可 以 改变 大 小 的 窗口 
NOFRAME 创建 一 个 没有 边框 的 窗口 


3) set caption() 
该 函数 设 定 游戏 程序 的 标题 。 当 游戏 以 窗口 模式 (对 应 于 全 屏 ) 运行 时 尤其 有 用 ， 因 
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为 该 标题 会 作为 窗口 的 标题 。 

4) get surface() 

该 函数 返回 一 个 可 用 来 画图 的 surface 对 象 。 

@ pygame.font 

pygame.font 模块 用 于 表现 不 同 字 体 ， 可 以 用 于 文本 。 

QO pygame.sprite 

pygame.sprite 模块 有 两 个 非常 重要 的 类 一 一 sprite 精灵 类 和 group 精灵 组 。 

sprite 精灵 类 是 所 有 可 视 游戏 的 基 类 。 为 了 实现 目 己 的 游戏 对 象 ， 需 要 子 类 化 sprite， 

盖 它 的 构造 函数 ， 以 设 定 image 和 rect 属性 (决定 sprite 的 外 观 和 放置 的 位 置 )， 再 禾 新 

update() 方 法 。 在 sprite 需要 更 新 的 时 候 可 以 调用 update() 方 法 。 

group 精灵 组 的 实例 用 作 sprite 精灵 对 象 的 容器 。 在 一 些 简单 的 游戏 中 ， 只 要 创建 名 为 
sprites、allsprite 或 是 其 他 类 似 的 组 ， 然 后 将 所 有 sprite 精灵 对 象 添 加 到 上 面 即 可 。 当 group 
精灵 组 对 象 的 update0 方 法 被 调用 时 会 自动 调用 所 有 sprite 精灵 对 象 的 update(0) 方 法 。group 
精灵 组 对 象 的 clear0 方 法 用 于 清理 它 包 含 的 所 有 sprite 对 象 〈 使 用 回调 函数 实现 清理 )， 
group 精灵 组 对 象 的 draw(0) 方 法 用 于 绘制 所 有 的 sprite 对 象 。 

© pygame.mouse 

该 模块 用 来 管理 鼠标 。 

。 pygame.mouse.set visible(False/true): [隐藏 /显示 鼠标 光标 。 


。 pygame.mouse.get pos(): 获取 鼠标 位 置 。 

7 pygame.event 

pygame.event 模块 会 退 踩 鼠标 单 击 、 鼠 标 移 动 、 按 键 按 下 和 释放 等 事件 。 其 中 , pygame 
.event.get () 可 以 获取 最 近 事 件 列表 。 

©@ pygame.image 

这 个 模块 用 于 处 理 保存 在 GIF、PNG 或 者 JPEG 内 的 图 形 ， 用 户 可 以 用 load0 函 数 来 
读 取 图 像 文件 。 


17.2 Pygame 的 使 用 


本 节 主 要 讲解 用 Pygame 开发 游戏 的 逻辑 、 鼠 标 事 件 的 处 理 、 键 盘 事件 的 处 理 、 字 体 
的 使 用 和 声音 的 播放 等 基础 知识 ， 最 后 以 一 个 “移动 的 坦 殉 ” 例 子 来 体现 这 些 基础 知识 的 
应 用 。 


17.2.1 Pygame 开发 游戏 的 主要 流程 


Pygame 开发 游戏 的 基础 是 创建 游戏 窗口 , 核心 是 处 理事 件 、 更 新 游戏 状态 和 在 屏 舌 上 
给 图。 游戏 状态 可 理解 为 程序 中 所 有 变量 值 的 列表 。 在 有 些 游戏 中 ， 游 戏 状态 包括 存放 人 
物 健康 和 位 置 的 变量 、 物 体 或 图 形 位 置 的 变化 ， 这 些 值 可 以 在 屏 人 梨 上 显示 。 

物体 或 图 形 位 置 的 变化 只 有 通过 在 屏幕 上 绘图 才能 看 出 来 。 
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PP 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


可 以 简单 地 抽象 出 Pygame 开发 游戏 的 主要 流程 ， 如 图 17-1 所 示 。 


True 
窗口 关闭 事件 QUIT 


False 


处 理 键盘 、 鼠 标 事件 
修改 游戏 的 状态 信息 
在 屏 几 上 绘图 


图 17-1 Pygame 开发 游戏 的 主要 流程 


下 面 举 一 个 具体 例子 来 说 明 。 
[ 例 ]17-1 使 用 Pygame 开发 一 个 显示 “Hello World!” 标 题 的 游戏 窗口 。 


import pygame # 导 入 pygame 模块 
from pygame.locals import * 


初始 化 Pygame 


载 和 游戏 相关 图 片 


创建 游戏 窗口 
进入 事件 循环 


import sys 

def hello world(): 
pygame.init()  ” # 任 何 Pygame 程序 均 需 要 执行 此 语句 进行 模块 的 初始 化 
# 设 置 窗口 的 模式 ，(680, 480) 表示 窗口 像素 
# 此 函数 返回 一 个 surface 对 象 ， 本 程序 不 使 用 它 ， 故 没 保存 到 对 象 变量 中 
pygame .display.set mode((680,480)) 
pygame .display.set caption('Hello World!') # 设 置 窗口 标题 


# 无 限 循环 ， 直 到 接收 到 窗口 关闭 事件 
while True : 
# 处 理事 件 
for event in pygame .event .get () : 
if event.type==QUuIT: # 接 收 到 窗口 关闭 事件 
pygame .quit () # 退 出 
SYS .exit () 


# 将 surface 对 象 绘制 在 屏幕 上 
pygame .display.update () 
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if name ==" main ": 
hello worlad() 
程序 运行 后 仅见 到 黑色 的 游戏 窗口 ， 标 题 是 “Hello World!”， 如 图 17-2 所 示 。 


演 Hello World! 


图 17-2 用 Pygame 开发 的 游戏 窗口 


在 导入 Pygame 模块 后 ,任何 Pygame 游戏 程序 均 需 要 执行 pygame.initO 语 句 进 行 模块 
的 初始 化 ， 它 必须 在 进入 游戏 的 无 限 循 环 之 前 被 调用 。 这 个 函数 会 日 动 切 始 化 其 他 所 有 模 
块 (例如 pygame.font 和 pygame.image)， 通 过 它 载 入 驱动 和 人 硬件 请 求 ， 这 样 游戏 程序 才 可 
以 使 用 计算 机 上 的 所 有 设备 ， 比 较 费 时 间 。 如 果 只 使 用 少量 模块 ， 应 该 分 别 初 始 化 这 些 模 
块 以 节省 时 间 ， 例 如 pygame.sound.init0 仅 仅 初始 化 声音 模块 。 

该 代码 中 有 个 无 限 循环 ， 每 个 Pygame 程序 都 需要 它 ， 在 无 限 循环 中 可 以 做 以 下 操作 。 

(1) 处 理事 件 : 例如 鼠标 、 键 盘 、 关 闭 窗口 等 事件 。 

(2) 更 新 游戏 状态 例如 坦克 的 位 置 变化 、 数 量变 化 等 。 

(3) 在 屏幕 上 绘图 : 例如 绘制 新 的 敌 方 坦克 等 。 

不 断 重 复 上 面 的 3 个 步骤 ， 从 而 完成 游戏 逻辑 。 

在 本 例 代 码 中 仅仅 处 理 关 闭 窗 口 事件 , 也 就 是 玩家 关闭 窗口 时 pygame.quitO 退 出 游戏 。 


17.2.2 Pygame 的 图 像 /图 形 绘制 


人 Pygame 的 图 像 绘 制 

Pygame 支持 多 种 存储 图 像 的 方式 〈 也 就 是 图 片 格 式 )， 例 如 JPEG、PNG 等 ， 有 具体 文 
持 JPEG 【一般 扩展 名 为 jpg 或 者 jpeg， 数 码 相 机 、 网 上 的 图 片 基本 上 都 是 这 种 格式 ， 这 是 
一 种 有 损 压 缩 方 式 ， 尽 管 对 图 片 的 质量 有 些 损 坏 ， 但 对 于 减 小 文件 尺寸 非常 棒 ， 其 优点 很 
多 ， 只 是 不 支持 透明 )、PNG (支持 透明 ， 无 损 压 缩 )、GIF (网 上 使 用 的 很 多 ， 支 持 透 明 
和 动画 ,但 只 能 有 256 种 颜色 ， 在 软件 和 游戏 中 的 使 用 很 少 ) 以 及 BMP、PCX、TGA、TIF 
等 格式 。 
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P,. 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


Pygame 使 用 surface 对 象 来 加 载 绘制 的 图 像 。 对 于 Pygame， 加 载 图 片 使 用 pygame 


但 surface 对 象 隐藏 了 这 些 不 同 。 用 户 可 以 对 一 个 surface 对 象 进行 涂 画 、 变 形 、 复 制 等 各 
种 操作 。 事 实 上 , 游戏 屏 适 也 只 是 一 个 surface, pygame.display.set mode0 返 回 了 一 个 surface 
对 象 。 

对 于 任何 一 个 surface 对 象 , 可 以 用 get widthO 、get heightO0 和 gei size() 函 数 来 获取 它 
的 尺寸 ，get rectO 用 来 获取 它 的 区 域 形状 。 

[ 例 j17-2 使 用 Pygame 开发 一 个 显示 坦克 自由 移动 的 游戏 窗口 。 


import pygame 
from pygame.locals import * 
import sys 
def Play tank(): 
pygame .1init () 


window size=(width, height)=(600, 400) # 窗 口 大 小 

specd TL 1 # 坦 克 运 行 偏 移 量 ， 即 [水 平 , 垂直 ] ， 值 越 大 ， 移 动 越 快 
color black=(255, 255, 255) # 窗 口 背 景色 RGB 值 (白色) 
screen=pygame.display.set mode (window size) # 设 置 窗口 模式 

pygame .display.set caption(' 自 由 移动 的 坦 殉 ') # 设 置 窗口 标题 


tank image=pygame.image.1load('tankU .bmp') 
# 加 载 坦 克 图 片 ， 返 回 一 个 surface 对 象 


tank rect=tank image.get rect () # 获 取 坦 克 图 片 的 区 域 形状 
while True: # 无 限 循 环 
for event in pygame .event .get(): 
if event.type==pygame .QUIT: # 退 出 事件 处 理 


pygame .quit () 
SYS .exit () 
# 使 坦克 移动 ， 速 度 由 speed 变量 控制 


tank rect=tank rect .move (speed) 


# 当 坦克 运动 出 窗口 时 重新 设置 偏 移 量 

ELEanE EECEEETIEEE 0 ORO (Ea Tectriiont > widthys 水 平方 回 
speed[0]=-speed[0] # 水 平方 同 反 问 

if(tank rect.top < 0) or (tank rect.bottom > height): # 亚 直方 向 
speed[1]=-speed[1] # 重 直方 向 反 回 

screen.fill (color black) # 填 充 窗 口 背 景 

screen.blit (tank image, tank rect) # 在 窗口 指定 区 域 tank rect 上 绘制 坦克 

pygame .display.update() # 更 新 窗口 显示 内 容 

if name ==' main '": 


play tank () 


程序 运行 后 ， 可 以 看 到 白色 背景 的 游戏 窗口 ， 标 题 是 “ 目 由 移动 的 坦 殉 ”， 如 图 17-3 
所 示 。 
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图 17-3 自由 移动 的 坦克 游戏 窗口 


在 该 游戏 中 通过 修改 坦克 图 像 (surface 对 象 ) 区 域 的 left 属性 (可 以 认为 是 x 坐标 )、 
surface 对 象 的 top 属性 (可 以 认为 是 y 坐标 〉 改变 坦 元 位 置 ， 从 而 显示 出 坦克 自由 移动 的 
效果 。 在 窗口 (窗口 也 是 surface 对 象 ) 使 用 的 blit0 函 数 上 绘制 坦克 图 像 ， 最 后 注意 需 
更 新 窗口 显示 内 容 。 

设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 ， 语 法 如 下 : 


fpsClock=pygame .time .Clock () 


在 无 限 循环 中 写 入 fpsClock.tick(50)， 可 以 按 指定 帧 频 50 更 新 游戏 画面 〈《 即 每 秒 钟 刷 
新 50 次 屏 舌 )。 

2 Pygame 的 图 形 绘制 

在 屏幕 上 绘制 各 种 图 形 时 使 用 pygame.draw 模块 中 的 一 些 函 数 ， 事 实 上 Pygame 可 以 
不 加 载 任何 图 片 ， 而 使 用 图 形 来 制作 一 个 游戏 。 

pygame.draw 中 国 数 的 第 1 个 参数 总 是 一 个 surface， 然 后 是 颜色 ， 接 着 是 一 系列 的 坐 
标 等 。 对 于 计算 机 中 的 坐标 ，(0.0) 代 表 左 上 角 ， 水 平 同 右 为 和 轴 的 正方 向 ， 垂 和 直 加 下 为 了 Y 
轴 的 正方 向 。 该 函数 的 返回 值 是 一 个 rect 对 象 ， 包 含 了 绘制 的 区 域 ， 这 样 就 可 以 很 方便 地 
更 新 那个 部 分 了 。pygame.draw 中 的 函数 如 表 17-3 所 示 。 

表 17-3 pygame.draw 中 的 函数 


函数 作 用 
rect0 绘制 线 

polygon0 “| 绘制 多 边 形 (3 个 及 3 个 以 上 的 边 ) 绘制 一 系列 的 线 
circle0 绘制 一 根 平滑 的 线 
slipse0 绘制 一 系列 平滑 的 线 
ac0 | 全 | 


下 面 详 细 说 明 pygame.draw 中 各 个 函数 的 使 用 。 
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P 项 目 案 例 开 发 
从 入 门 到 实战 一 王 爬 虫 、 游 戏 和 机 器 学 习 


1) pygame.draw.rectO 

格式 : pygame.draw.rect(surface, color,rect,width=0) 

pygame.draw.rect0 在 surface 上 男 一 个 定形 ， 除 了 surface 和 color 以 外 ，rect 接受 一 个 
窍 形 的 坐标 和 线 宽 参数 ， 如 果 线 宽 是 0 或 省 略 ， 则 填充 。 

2) pygame.draw.polygon0) 

格式 : pygame.draw.polygon(surface, color pointlist, width=0) 

polygon0 用 于 画 多 边 形 ， 其 用 法 类 似 于 rect0， 与 rect0 的 第 1、 第 2、 第 4 个 参数 都 是 
相同 的 ， 只 不 过 polygon0 会 接受 一 系列 坐标 的 列表 ， 代 表 了 各 个 项 点 的 坐标 。 

3 ) pygame.draw.circle() 

格式 : pygame.draw.circle(surface, color pos, radius, width=0) 

circle0 用 于 男 一 个 圆 ， 它 接受 一 个 圆心 坐标 和 半径 参数 。 

4) pygame.draw.ellipse0 

格式 : pygame.draw.ellipse(surface, color rect, width=0) 

用 户 可 以 把 ellipse 想象 成 一 个 被 压 忆 的 圆 ， 事 实 上 ， 它 可 以 被 一 个 矩形 六 起 来 。 
pygame.draw.ellipse0 的 第 3 个 参数 就 是 这 个 椭圆 的 外 接 和 矩形 。 

3 ) pygame.draw.arcO) 

格式 : pygame.draw.arc(surface,color,rect,start angle,stop angle,width=1) 

arc 是 椭圆 的 一 部 分 ， 所 以 它 的 参数 比 椭圆 多 一 点 。 但 是 它 是 不 封闭 的 ， 因此 没有 fill0 
方法 。start angle 和 stop angle 为 开始 和 结束 的 角度 。 

6) pygame.draw.lineO 

格式 : pygame.draw.line(surface,color,start pos,end pos,width=1) 

line0 用 于 画 一 条 线段 ，start pos、end pos 是 线段 起 点 和 终点 坐标 。 

7) pygame.draw.lines() 

格式 : pygame.draw.lines(surface,color,closed,pointlist,width=1) 

closed 是 一 个 布尔 变量 ， 指 明 是 否 需 要 多 男 一 条 线 来 使 这 些 线 条 闭合 (这 样 就 和 
polygon 一 样 了 )，pointlist 是 一 个 顶点 坐标 的 数组 。 


17.2.3 ”Pygame 的 键盘 和 鼠标 事件 的 处 理 


所 谓 事 件 ， 就 是 程序 上 发 生 的 事 。 例 如 用 户 按键 盘 上 的 茶 个 键 或 是 单 击 、 移 动 鼠 标 。 
对 于 这 些 事件 ， 游 戏 程序 需要 做 出 反应 。 在 例 17-2 中 ， 程 序 会 一 直 运 行 下 去 ， 直 到 用 户 关 
闭 窗口 而 产生 了 一 个 QUIT 事件 ，Pygame 会 接收 用 户 的 各 种 操作 〈 例 如 按键 盘 上 的 键 、 移 
动 鼠 标 等 ) 产生 事件 。 事 件 随时 可 能 发 生 ， 而 且 量 可 能 会 很 大 ，Pygame 的 做 法 是 把 一 系列 
事件 存放 到 一 个 队列 里 逐个 处 理 。 

在 例 17-2 中 使 用 了 pygame.event.get() 来 处 理 所 有 事件 , 如 果 使 用 pygame.event.wait()， 
Pygame 会 等 到 友 生 一 个 事件 时 才 继 续 下 去 , 一 般 在 游戏 中 不 太 实用 ,因为 游戏 往往 是 需要 
动态 运作 的 。Pygame 中 的 第 用 事件 如 表 17-4 所 示 。 
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表 17-4 Pygame 中 的 常用 事件 


事件 参数 
QUIT 用 户 按 下 “关闭 ”按钮 none 
ACTIVEEVENT Pygame 被 激活 或 者 隐藏 gain、state 
KEYDOWN Unlcode、key、mod 
KEYUP 


键盘 被 放 开 key、mod 


MOUSEMOTION 鼠标 移动 pos、rel、buttons 


MOUSEBUTTONDOWN 鼠标 被 按 下 pos、button 


MOUSEBUTTONUP 鼠标 被 放 开 pos、button 


@ Pygame 的 键盘 事件 的 处 理 

通常 用 pygame.event.get() 获 取 所 有 事件 ， 奎 event.type == KEYDOWN， 这 时 是 键盘 事 
件 ， 再 判断 按键 event.key 的 种 类 ( 即 K a、K b、K LEFT 这 种 形式 )。 用 户 也 可 以 使 用 
pygame.key.get_pressed() 获 取 所 有 被 按 下 的 键 值 , 它 会 返回 一 个 元 组 ,这 个 元 组 的 索引 就 是 


健 值 ， 对 应 的 就 是 键 是 人 否 被 按 下 。 


pressed keys=pygame.Kkey.get Pressed () 
if pressed keys[K SPACE] : 

# 空 格 键 被 按 下 

fire ()# 发 射 子弹 


在 key 模块 下 有 很 多 函数 。 

。 key.get focused0: 返回 当前 的 Pygame 窗口 是 人 否 补 激活。 
e key.get pressed0: 获得 所 有 按 下 的 键 值 。 

。 key.get mods0: 按 下 的 组 合 键 (Alt、Ctrl、Shift)。 


。 keyset mods0: 模拟 按 下 组 合 键 的 效果 (KMOD ALT、KMOD CTRL、KMOD 


SHIFT )。 


[ 例 ]17-3 使 用 Pygame 开发 一 个 由 用 户 控制 坦克 移动 的 游戏 。 在 例 17-2 的 基础 上 


增加 通过 方 回 键 控制 坦克 运动 的 功能 ， 并 为 游戏 增加 背景 图 片 。 程 序 的 运行 效果 如 图 17-4 


所 不。 


import os 

import sys 

import pygame 

from pygame.locals import * 


def control tank (event): # 控 制 坦 殉 运 动 函 数 
speed=[x,y]=[0, 0] # 相 对 坐标 
speed offset=1 # 速 度 
# 当 方 同 键 被 按 下 时 进行 位 置 计算 


1f event.type==pygame .KEYDOWN : 
if event.key==pygame.K LEFT: 
speed[0]-=speed offset 
if event.key==pygame.K RIGHT : 
Sooodll soe otseE 


P 项 目 案例 开发 
从 入 门 到 实战 一 爬虫 、 游 戏 和 机 器 学 习 


if event .key==pygame -K_ UP : 
speed[l1]-=speed offset 
If event.key==pygame.K DOWN: 
speed[l1]=speed offset 
# 当 方向 键 被 释放 时 相对 偶 移 为 0， 即 不 移动 
if event .type in (Pyqame .KEYUP，PpPydame.-K LEFT, pygame.K RIGHT, pygame 
.K DOWN ) 
Speed=[0，0j 
return Speed 
def play tank() : 
pygame .1init () 


window size=Rect (0, 0, 600, 400) # 窗 口 大 小 
SEO 站 Ra # 坦 克 运 行 偏 移 量 ， 即 [水 平 , 街 直 ] ， 值 越 大 ， 移 动 越 快 
ET DI ES # 窗 口 背 景色 RGB 值 (白色 ) 


screen=pygame.display.set mode (window size.size) # 设 置 窗口 模式 
pygame .display.set caption(' 用 户 方向 键 控制 坦克 移动 ')  # 设 置 窗口 标题 


tank image=pygame.image.1load('tankU.bmp') # 加 载 坦克 图 片 
# 加 载 窗口 背景 图 片 
back image=pygame.image.load('back image.]Jpg') 
tank rect=tank image.get rect() # 获 取 坦 元 图 片 的 区 域 形 状 
while True: 
# 退 出 事件 处 理 
for event in pygame.event .get(): #pygame .event .get () 获取 事件 序列 


if event.type==pygame .QUIT: 
pygame .quit () 
sys.exit () 
# 使 坦克 移动 ， 速 度 由 speed 变量 控制 
cur speed=control tank (event) 


#rect 的 clamp () 方 法 使 移动 范围 限制 在 窗口 内 


tank rect=tank rect .move (cur speed) .clamp (window size) 


Sereen biit(baer mage (0 or) # 设 置 窗口 背景 图 片 

screen.blit (tank image,tank rect) # 在 窗口 上 绘制 坦克 

pygame .display.update () # 更 新 窗口 显示 内 容 
if name ==' main '": 


play tank () 


当 用 户 按 下 方 同 键 ， 计 算出 相对 位 置 cur speed 后 ， 使 用 tank rect.move(cur speed) 函 
数 回 指定 方 同 移动 坦 元 。 当 释放 方 同 键 时 坦克 停止 移动 。 
@ Pygame 的 鼠标 事件 的 处 理 
pygame.mouse 的 函数 如 下 。 
。 pygame.mouse.get pressed0: 返回 按键 的 按 下 情况 ， 返 回 的 是 一 元 组 ， 分 别 为 左 键 、 
中 键 、 右 键 ， 如 果 被 按 下 则 为 True。 
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图 17-4 用 方向 键 控 制 坦 克 运 动 的 游戏 窗口 


。 pygame.mouse.get_rel(): 返回 相对 仿 移 量 ， 即 (x 方 回 偶 移 量 ，y 方 回 偶 移 量 ) 的 一 
元 组 。 

e。 pygame.mouse.get pos(): 返回 当前 鼠标 位 置 (x, y)。 

例如 “x,y=pygame.mouse.get pos()” 用 于 获取 鼠标 位 置 。 

e。 pygame.mouse.set pos(): 设置 鼠标 位 置 。 

。 pygame.mouse.set visible(): 设置 鼠标 光标 是 否 可 见 。 

e。 pygame.mouse.get focused0: 如 果 鼠 标 在 Pygame 窗口 内 有 效 ， 返 回 True。 

。 pygame.mouse.set _ cursor(): 设置 鼠标 的 默认 光标 样式 。 

。 pygame.mouse.get cursor(): 返回 鼠标 的 光标 样式 。 

[ 例 ]17-4 演示 鼠标 事件 处 理 的 程序 ， 运 行 效果 如 图 17-5 所 示 。 


import pygame 
from pygame.locals import * 
from sys import exit 
from random import * 
from math import pi 
pygame .init () 
screen=pygame.display.set mode((640, 480), 0, 32) 
points=[] 
while True: 
for event in pygame.event .get () : 
if event .type==QUIT: 
pygame .quit () 
exit() 
1If event .type==KEYDOWN: 


# 按 任意 键 可 以 清 屏 ， 并 把 点 回复 到 原始 状态 


points=[] 
screen.fill((255,255,255)) # 用 白色 填充 窗口 背景 
if event .type==MOUSEBUTTONDOWN : # 鼠标 按 下 
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也 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


Scereen Fill TY SS 人 与 .255)) 

# 夯 随机 算 形 

rc=(255,0,0) # 红 色 

rp=(randint (0,639), randint (0,479)) 

rs=(639-randint (rp[0],639),479-randint (rp[1],479)) 

pygame .draw.rect (screen, rc,Rect (rp, rs)) 

# 画 随机 圆 形 

rc=(0,255, 0) # 绿 色 

rp= (randint (0,639),randint (0,479)) 

rr=randint (1,200) 

pygame .draw.circle (screen,rc,rp,rr) 

# 获 得 当前 鼠标 单 击 位 置 

x ypyYgame -mouse-get pos1) 

polnts .append ( (x, y)) 

# 根 据 单 击 位 置 画 弧 线 

angle= (x/639.)*pi*2. 

pygame -draw-arc{tscreen, (0 0 (0 0.639.419) .0-angle,.3) 

# 根 据 单 击 位 置 画 椭圆 

pydame .draw.ellipse (screen, (0,255,0), (0,0,x,y)) 

# 从 左上 和 右 下 画 两 根 线 连接 到 单 击 位 置 

pygame .draw.line (screen, (0,0,255), (0,0), (x,y)) 

pygame .draw.line (Screen,， (255,0,0), (640,480), (x,y)) 

# 夯 单 击 轨迹 图 

if len (points)>1: 

pygame .draw.lines (screen, (155,155,0),False,points,2) 

# 和 轨迹 图 基本 一 样 ， 只 不 过 是 闭合 的 ， 因 为 会 窗 盖 ， 所 以 这 里 注释 了 

#if len (points)>=3: 

# pygame.draw.polygon (screen, (0,155,155),points,2) 

# 把 每 个 点 画 明 显 一 点 

for p in points: 

pygame .draw.circle(screen, (155,155,155),p,3) 

pygame .display.update () 


容 pygame window 


运行 这 个 程序 ， 在 窗口 上 单 击 鼠 标 融 会 有 图 形 出 来 ， 按 任意 键 可 以 重新 开始 。 
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17.2.4 Pygame 的 字体 使 用 


Pygame 可 以 直接 调用 系统 字体 ， 也 可 以 调用 TTF 字体 。 为 了 使 用 字体 ， 首 先 应 该 创 
建 一 个 Font 对 象 ， 对 于 系统 目 市 的 字体 应 该 这 样 调用 : 


fontl=pygame.font.SysFont ('arial', 16) 


第 1 个 参数 是 字体 名 ， 第 2 个 参数 是 字号 。 在 正常 情况 下 系统 里 都 会 有 arial 字体 ， 如 
果 没 有 会 使 用 默认 人 字体， 默认 字体 和 用 户 使 用 的 系统 有 关 。 
用 户 可 以 使 用 pygame.font.get fonts0) 来 获取 当前 系统 所 有 的 可 用 字体 : 


>>> Pygdame .ftont .get ftonts () 

'gisha', 'fzshut1'，' SImsunnslmsun'， 'estrangeloedessa', 
'symboltigerexpert"', 'jJuiceitc', ‘onyx', ‘tiger', "webdqings ' ， 
'franklingothicmediumcond', ‘'edwardianscriptitc' 


男 外 还 有 一 种 调用 方法 是 使 用 目 己 的 TIF 字体 : 

mmY=EOoE=Pygamenaonesee YEOnE LEEE ?pte) 

这 个 方法 的 好 处 是 可 以 把 字体 文件 和 游戏 一 起 打包 分 及 ， 避 免 玩 家 计算 机 上 没有 这 个 
字体 而 无 法 显示 的 问题 。 一 旦 有 了 Font 对 象 ， 就 可 以 用 render() 方 法 来 设置 文字 内 容 ， 然 
后 通过 blit0 方 法 写 到 屏幕 上 : 


text=font1 .render ("坦克 大 战 ", True, (0,0,0)，, (255,255,255)) 


render() 方 法 的 第 1 个 参数 是 写 入 的 文字 内 容 ; 第 2 个 参数 是 布尔 值 ， 说 明 是 否 开 局 抗 
锯齿 ; 第 3 个 参数 是 字体 本 号 的 闫 色 ; 第 4 个 参数 是 背景 的 颜色 。 如 有 果 不 想 有 背景 色 ， 也 
就 是 让 背景 透明 ， 可 以 不 加 第 4 个 参数 。 

例如 自己 定义 一 个 文字 处 理 函 数 show_text(, 其 中 参数 surface handle 为 surface 句柄 ， 
pos 为 文字 显示 位 置 , color 为 文字 颜色 , font bold 为 是 否 加 粗 , font size 为 字体 大 小 , font 
italic 为 是 售 斜 体 。 

def Show text (surface handle, pos, text, color, font bold=False, font 

size=13, font italic=False): 

#cur font=pygame .font.SysFont ("宋体 ",，font size) # 获 取 系 统 字 体 
cur font=pygame.font.Font('simfang.ttf', 30)  # 获 取 字 体 ， 并 设置 文字 大 小 


cur font.set bold(font bold) # 设 置 是 否 加 粗 
eur Font set Talicl(liont Titale) # 设 置 是 否 和 斜体 
text fmt=—cCur font:render (texts 1 CoLor) # 设 置 文字 内 容 
surface handle.blit (text fmt, pos) # 绘 制 文字 


在 更 新 窗口 内 容 pygame.displayupdate0 之 前 加 入 : 


text pos=u "坦克 大 战 " 
Show text (screen, (20, 220), text pos, (255, 0, 0), True) 
text pos=u" 坦 克 位 置 : (%d,%d)" %$ (tank rect.left, tank rect.top) 
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P,. 项 目 案 例 开 发 
从 入 门 到 实战 一 一 假 虫 、 游 戏 和 机 器 学 习 


1 


此 时 会 在 屏幕 上 的 (20, 220) 处 显示 红色 的 “坦克 大 战 ” 文 字 ， 并 且 在 (20, 420) 处 显示 现 
在 坦克 所 处 位 置 的 坐标 ， 移 动 坦克 ， 位 置 坐标 文字 同时 会 改变 。 


17.2.5 ”Pygame 的 声音 播放 


@@ Sound 对 象 

在 初始 化 声音 设备 后 就 可 以 读 取 一 个 音乐 文件 到 一 个 Sound 对 象 中 。pygame.mixer 
.sound() 接 受 一 个 文件 名 ， 也 可 以 是 一 个 文件 对 象 ， 不 过 这 个 文件 必须 是 WAV 或 者 OGG 
文件 。 

hello sound=pygame.mixer.sound("hello.ogg") # 建 立 Sound 对 象 

hello sound.play() # 声 音 播放 一 次 


一 旦 这 个 Sound 对 象 出 来 了 ， 就 可 以 使 用 play0 来 播放 它 。play(loop, maxtime) 可 以 接 
受 两 个 参数 ，loop 是 重复 的 次 数 〈 取 1 是 两 次 ， 注 意 是 重复 的 次 数 而 不 是 播放 的 次 数 )， 
-] 意味 着 无 限 循环 ， maxtime 是 指 多 少 毫秒 后 结束 。 

右 不 使 用 任何 参数 调用 ， 意 味 着 把 这 个 声音 播放 一 次 。 一 旦 play(0 方 法 调用 成 功 ， 残 
会 返回 一 个 Channel 对 象 ， 人 否则 返回 一 个 None。 

从 music 对 象 

在 Pygame 中 还 提供 了 pygame.mixer.music 类 来 控制 背景 音乐 的 播放 。pygame 
.mixer.music 用 来 播放 MP3 和 OGG 音乐 文件 , 不 过 MP3 并 不 是 所 有 的 系统 都 文 持 (Linux 
默认 就 不 支持 MP3 播放 )。 用 户 可 以 用 pygame.mixer.music.load() 加 载 一 个 文件 ， 然 后 使 用 
pygame.mixer.music.play() 播 放 ， 不 放 的 时 候 就 用 stop0 方 法 停止 ， 当 然 也 有 类 似 录 影 机 上 
的 pause() 和 unpause0 方 法 。 

# 加 载 背 景 音乐 


pygame .mixer .music.1load ("hello.mp3") 


pygame .mixer.music.set volume (music volume/100.0) 
# 循 环 播放 ， 从 音乐 的 第 30 秒 开始 

pygame .mixer.music.play(-1, 30.0) 

在 游戏 退出 事件 中 加 入 停止 音乐 播放 的 代码 : 

# 停 止 音 乐 播放 

pygame .mixer .music.stop() 

music 对 象 提 供 了 丰富 的 函数 方法 ， 下 面 分 别 介绍 。 

1) pygame.mixer.music.load() 

功能 : 加 载 音 乐 文件 。 

格式 : pygame.mixer.music.load(filename) 


2) pygame.mixer.music.play() 


功能 : 播放 音乐 。 
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格式 : pygame.mixer.music.play(loops=0,start=0.0) 
其 中 ，loops 表示 循环 次 数 ， 如 果 设 置 为 -1， 表 示 不 停 地 循环 播放 ， 如 果 loops 为 S， 则 播 
放 5+1=6 次 ; start 参数 表示 从 音乐 文件 的 哪 一 秒 开始 播放 ， 设 置 为 0 表示 从 开始 完整 
播放 。 

3 ) pygame.mixer.music.rewind() 

功能 : 重新 播放 。 

格式 : pygame.mixer.music.rewind() 

4) pygame.mixer.music.stop() 

功能 : 停止 播放 。 

格式 : pygame.mixer.music.stop() 

$) pygame.mixer.music.pause() 

功能 : 暂 仿 播放 。 

格式 : pygame.mixer.music.pause() 

用 户 可 通过 pygame.mixer.music.unpause() 恢 复 播放 。 

6) pygame.mixer.music.set volume() 

功能 : 设置 音量 。 

格式 : pygame.mixer.music.set _ volume(value) 
其 中 ，value 的 取 值 为 0.0 一 1.0。 

7) pygame.mixer.music.get pos() 

功能 : 获取 当前 播放 了 多 长 时 间 。 


格式 : pygame.mixer.music.get pos(): return time 


17.2.6 ”Pygame 的 精灵 使 用 


pygame.sprite.Sprite 是 Pygame 中 用 来 实现 精灵 的 一 个 类 , 在 使 用 时 并 不 需要 对 它 实 例 
化 ， 只 需要 继承 它 ， 然 后 按 需 写 出 目 己 的 类 ， 因 此 非常 简单 、 实 用 。 

@ 精灵 

育 灵 可 以 被 认为 是 一 个 个 小 图 片 〈 帧 ) 序列 《例如 人 物 行 走 )， 它 可 以 在 屏 医 上 移动 ， 
并 且 可 以 与 其 他 图 形 对 象 交 互 。 精 灵图 像 可 以 是 使 用 Pygame 绘制 形状 函数 绘制 的 形状 ， 
也 可 以 是 图 像 文 件 。 图 17-6 所 示 为 由 16 帧 图 片 组 成 的 人 物 行走 序列 。 

@ Sprite 类 的 成 员 

pygame.sprite.Sprite 用 来 实现 精灵 类 ，Sprite 的 数据 成 员 和 图 数 方法 主要 如 下 。 

1) selfimage 

其 负责 显示 什么 图 形 ， 例 如 selfimage=pygame.Surface([x.y]) 说 明 该 精灵 是 一 个 xxy 大 
小 的 矩形 ，selfimage=pygame.image.load(filename) 说 明 该 精灵 显示 flename 这 个 图 片 文件 。 

self.image.fill([color]) 负 责 对 selfimasge 着 色 ， 例 如 : 


self.image=pygame.Surface([x,y]) 


Self -imade FilL(tI255 0.01) # 对 xxy 大 小 的 矩形 填充 红色 
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I 
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图 17-6 精灵 图 片 序列 


2) self.rect 

其 负责 在 哪里 显示 ,一 般 来 说 , 先 用 self.rect=self.image.get rect() 获 取 image 窍 形 大 小 ， 
然后 给 selfrect 设 定 显示 的 位 置 ， 一般 用 selfrecttopleft 确定 左上 角 的 显示 位 置 ， 当 然 也 可 
以 用 topright、bottomright、bottomleft 分 别 确定 其 他 几 个 角 的 位 置 。 

另外 ，selfrecttop、selfrectbottom、selfrectleft、selfrectright 分 别 表示 上 上、 下、 左 、 右 。 

3) self.update() 

其 负责 使 精灵 行为 生效 。 

4) Sprite.add() 

添加 精灵 到 groups 中 。 

$5) Sprite.removel() 

从 精灵 组 groups 中 删除 。 

6) Sprite.kill() 

从 精灵 组 groups 中 删除 全 部 精灵 。 

7) Sprite.alive() 

判断 茶 个 精灵 是 个 属于 精灵 组 groups。 

@ 建立 精灵 

所 有 精灵 在 建立 时 都 是 从 pygame.sprite.Sprite 中 继承 的 ,建立 精灵 要 设计 自己 的 精灵 类 。 

[ 例 ]17-$ 建立 Tank 精灵 。 


import pygame,sys 

pygame .init () 

Class Tank (pygame.sprite.sprite): 

def init (self,filename,initial position): 

pygame.sprite.sprite. init (self) 
self.image=pygame.image.1load (filename) 
self.rect=self.image.get rect() # 获 取 self .image 的 大 小 
#self.rect.topleft=initial position # 确 定 左 上 角 的 显示 位 置 
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self.rect.bottomright=initial position # 右 下 角 的 显示 位 置 是 [150,100] 


screen=pygame.display.set mode([640,480]) 
screen2fiLlL(1255.255.2551) 
£1i="'tankU .jpg' 
b=Tank (fi, [150,100]) 
while True: 

for event in pygame.event .get () : 

if event .type==pygame .QUIT : 
SYS .exit () 
screen.blit (b.image,b.rect) 


pygame .display.update () 


圆 17-6 使 用 图 17-6 所 示 的 精灵 图 片 序列 建立 动画 效果 的 人 物 行走 精灵 。 
在 游戏 动画 中 ， 人 物 行走 是 基本 动画 ， 在 精灵 中 不 断 切 换 人 物 行走 图 片 ， 从 而 达到 动 
画 的 效果 。 


import pygame 

from pygame.locals import * 

class MySprite (pygame.sprite.sprite): 

def 1init (self, target): 

pygame.sprite.sprite. init (self) 
self.target surface=target 
self.image=None 
self.master image=None 
self.rect=None 
self.topleft=0,0 
self.frame=0 
self.old frame=-1 
self.frame width=1 
self.frame height=1 


self.first frame=0 # 第 1 帧 序号 
aed last Erams=0 # 最 后 一 帧 序号 
self.columns=1 # 列 数 


self.last time=0 


在 加 载 一 个 精灵 图 片 序列 的 时 候 需 要 告知 程序 一 帧 的 大 小 ( 传 入 帧 的 宽度 和 高 度 以 及 
文件 名 和 列 数 )。 


def load(self, filename, width, height, columns): 
self.master image=pygame.image.load(filename) .convert alpha() 
self.frame width=width 
self.frame height=height 
self.rect=0,0,width,height 
self .columns=columns 


rect=self.master image.get rect () 
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self.last frame=(rect.width//width)*(rect.height//height)-1 


一 个 循环 动画 通常 是 这 样 工作 的 : 从 第 1 帧 开始 不 断 地 加 载 直 到 最 后 一 巾 ， 然 后 再 返 
回 第 1 帧 ， 并 不 断 重 复 这 个 操作 。 

但 是 如 条 只 是 这 样 做 ， 程 序 会 一 股 脑 地 将 动画 播放 完 ， 这 里 想 让 它 根据 时 间 间 隅 一 张 
一 张 地 播放 ， 因 此 加 入 定时 的 代码 ， 将 帧 速率 ticks 传递 给 Sprite 的 update0 函 数 ， 这 样 就 
可 以 轻松 地 让 动画 按照 帧 速率 来 播放 。 

def update(self, current time, rate=60): 
if current time>self.last time + rate: # 如 果 时 间 超 过 上 次 时 间 +60 毫秒 


self.frame+=1 # 帧 号 加 1， 意味 着 显示 下 一 帧 图 像 
if self.frame>self.1last frame: # 帧 号 超过 最 后 一 帧 
self.frame=self.first frame # 回 到 第 1 帧 


self.last time=current 七 Ime 

if self.frame!=self.old frame: 
# 首 先 需 要 计算 单个 帧 左上 角 的 x、y 位 置 值 
irame x— (self.frame % Selfccolumns) * self.frame width 
framedy (SelE Erame /Self colmsy * self.frame height 
# 然 后 将 计算 好 的 x, y 值 传递 给 位 置 属性 


rect= (frame x, frame y, self.frame width, self.frame height) 


# 要 显示 区 域 
self.image=self.master image.subsurface (rect) 
# 截 取 要 显示 区 域 图 像 


self.old frame=self .frame 
pygame .init () 
screen=pygame.display.set mode((800,600),0,32) 
pygame .display.set caption ("精灵 类 测试 ") 
font=pygame.font.Font (None, 18) 
# 启 动 一 个 定时 器 ， 然 后 调用 tick (num) 函数 就 可 以 让 游戏 以 num 帧 来 运行 
framerate=pygame.time.Clock () 
cat=MySprite (screen) 
Et To ("soriter on oo Ed) # 精 灵图 片 ， 每 巾 92x95 大 小 ， 共 4 列 
group=pygame .sprite.Group() 
group.add (cat) 


“hule True 


framerate .tick(10) # 指 定 帧 速率 
ticks=pygame .time.get ticks() # 获 取 运 行 时 间 


for event in pygame.event .get () : 
if event .type==pygame .QUIT : 
pygame .quit () 
rt 
key=pygame .key.get pressed () 
if key[pygame.K ESCAPE]: #Esc 键 
exit{) 
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screen.fill((0,.0.100)) 

#cat .draw (screen) # 没 有 此 方法 
cat .update (ticks) 

screen.blit (cat.image, cat.rect) 

#group.update (ticks) 

#group.draw (screen) 

pygame .display.update () 


运行 后 可 见 一 个 人 物 行走 动画 ,用户 也 可 以 使 用 精灵 组 的 update0 和 draw0 函 数 实现 精灵 


男 | 。 


group.update (ticks) 
# 将 帧 速率 ticks 传递 给 sprite 的 update () 函数 ， 让 动画 按照 帧 速率 来 播放 


group.draw (screen) 
@ 建立 精灵 组 
当 程 序 中 有 大 量 实体 的 时 候 ， 操 作 这 些 实体 将 会 是 一 件 相当 及 烦 的 事 ， 那 么 有 没有 什 


么 容 髓 可 以 将 这 些 精 灵 放 在 一 起 统一 管理 呢 ? 答案 就 是 使 用 精灵 组 。 


Pygame 使 用 精灵 组 来 管理 精灵 的 绘制 和 更 新 ， 精 灵 组 是 一 个 简单 的 容器 。 
使 用 pygame.sprite.Group() 函 数 可 以 创建 一 个 精灵 组 : 


group=pygame .sprite.Group() 
group.add (sprite one) 


青 灵 组 也 有 update0 和 draw() 函 数 : 


group.update () 
Group .draw () 


Pygame 还 提供 了 精灵 与 精灵 之 间 的 冲突 检测 、 精灵 与 组 之 间 的 碰撞 检测 , 这 些 碰撞 检 


测 技 术 在 17.4 节 的 飞机 大 战 游戏 中 要 使 用 。 


测 。 


全 精灵 与 精灵 之 间 的 碰撞 检测 
1) 两 个 精灵 之 间 的 矩形 检测 
在 只 有 两 个 精灵 的 时 候 可 以 使 用 pygame.sprite.collide rect0 函 数 进行 一 对 一 的 冲突 检 
这 个 函数 需要 传递 两 个 精灵 ， 并 且 每 个 精灵 都 需要 继承 目 pygame.sprite.Sprite。 
这 里 举 个 例子 : 
spirte 1=MySprite("sprite 1.png",200,200,1) 

#MySprite 是 例 17-6 创建 的 精灵 类 
sprite 2=MySprite("sprite 2.png",50,50,1) 
result=pygame.sprite.collide rect(sprite 1,sprite 2) 


1 PesillEe.: 


print ("精灵 碰撞 上 了 ") 


2) 两 个 精灵 之 间 的 圆 检 测 
定形 冲突 检测 并 不 适用 于 所 有 形状 的 精灵 , 因此 在 Pygame 中 还 提供 了 圆 形 冲 突 检测 。 


pygame.sprite.collide _ circle() 函 数 是 基于 每 个 精灵 的 半径 值 来 进行 检测 的 ， 用 户 可 以 目 己 指 
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定 精 灵 半 径 ， 或 者 让 函数 计算 精灵 半径 。 


result=pygame.sprite.collide circlel(sprite 1,sprite 2) 


1 Fesull. 


print ("精灵 碰撞 上 了 ") 


3) 两 个 精灵 之 间 的 像素 遮 单 检测 

如 果 和 矩形 检测 和 辆 形 检 测 都 不 能 满足 需求 ,Pygame 还 为 用 户 提供 了 一 个 更 加 精确 的 检 
测 一 一 pygame.sprite.colllde mask()。 

这 个 函数 接受 两 个 精灵 作为 参数 ， 返 回 值 是 一 个 bool 变量 。 


if pygame.sprite.collide mask (sprite 1,sprite 2): 


print ("精灵 碰撞 上 了 ") 


4) 精灵 和 组 之 间 的 矩形 冲突 检测 

在 调用 pygame.sprite.spritecollide(sprite,sprite group,bool) 函 数 的 时 候 , 一 个 组 中 的 所 有 
精灵 都 会 逐个 地 对 男 外 一 个 单个 精灵 进行 冲突 检测 ,发 生 冲 突 的 精灵 会 作为 一 个 列表 返回 。 

这 个 函数 的 第 1 个 参数 是 单个 精灵 ， 第 2 个 参数 是 精灵 组 ， 第 3 个 参数 是 一 个 bool 
值 ， 最 后 这 个 参数 起 了 很 大 的 作用 ， 当 为 True 的 时 候 会 删除 组 中 所 有 冲突 的 精灵 ， 当 为 
False 的 时 候 不 会 删除 冲突 的 精灵 。 

list collide=pygame.sprite.spritecollide (sprite, sprite group,False); 

另外 ， 这 个 函数 还 有 一 个 变 体 一 一 pygame.sprite.spritecollldeanyO0， 这 个 函数 在 判断 精 
灵 组 和 单个 精灵 冲突 的 时 候 会 返回 一 个 bool 值 。 

5) 精灵 组 之 间 的 矩形 冲突 检测 

利用 pygame.sprite.groupcollide0 函 数 可 以 检测 两 个 组 之 间 的 冲突 , 它 返 回 一 个 字典 ( 键 
值 对 )。 

以 上 学 习 了 几 种 常用 的 冲突 检测 函数 ， 下 面 在 游戏 实例 中 实际 运用 这 些 函 数 。 


17.3 ”基于 Pygame 设计 贪 吃 蛇 游 戏 


贪 吃 蛇 游 戏 通 过 玩家 控制 蛇 移 动 ， 不 断 吃 到 食物 〈 红 色 草 莓 ) 增长 ， 直 到 蛇 身 碰 到 边 
界 游戏 结束 。 其 运行 效果 如 图 17-7 所 示 。 


import pygame, sys, time, random 
from pygame.locals import * 


输入 下 面 的 两 行 来 启用 Pygame， 这 样 Pygame 在 该 程序 中 就 可 以 用 了 : 


pygame .init () 
fpsClock=pygame .time .Clock () 


第 1 行 告诉 Pygame 初始 化 ， 第 2 行 创建 一 个 名 为 fpsClock 的 变量 ， 该 变量 用 来 控制 
游戏 的 速度 。 然 后 用 下 面 的 两 行 代码 新 建 一 个 Pygame 显示 层 〈 游 戏 元 素 画 布 )。 
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| Raspberry Snake 


图 17-7 基于 Pygame 设计 的 人 上 吃 蛇 游 戏 的 运行 效果 


playSurface=pygame .display.set mode((640, 480)) 
pygame .display.set caption('Raspberry Snake ' ) 


接 下 来 定义 一 些 颜 色 ， 虽 然 这 一 步 并 不 是 必需 的 ， 但 它 会 减少 代码 量 。 下 面 的 代码 定 
义 了 程序 中 用 到 的 闫 色 : 

redColour=pygame .Color (255, 0, 0) 

blackColour=pygame .Color (0, 0, 0) 


whiteColour=pygame .Color (255, 255, 255) 
greyColour=pygame .Color (120， 150, 150) 


下 面 的 几 行 代码 初始 化 了 程序 中 用 到 的 一 些 变 
开始 时 这 些 变量 为 空 ，Python 将 无 法 正常 运行 。 


量 ， 这 是 很 重要 的 一 步 ， 因 为 如 果 游 戏 


snakePosition=[100,100] # 蛇 头 位 置 
snakeSegments=[[100,100],[180,100],[60,100]] # 肉 刁 序 列 
raspberryPosition=[300,300] # 草 每 位 置 
raspberrySpawned=1 # 是 否 吃 到 草 薛 ，1 为 没有 吃 到 ，0 为 吃 到 
direction "reign # 运 动 方向， 初始 回 右 


changeDirection=direction 

此 时 可 以 看 到 变量 snakePosition、snakeSegments 和 raspberryPosition 被 设置 为 用 逗号 
分 隅 的 列表 。 

用 下 面 几 行 代 但 来 定义 gameOver() 函 数 : 

def gameOver () : 


dameOVerFEont=pydgdame .ftont .Font ("freesansbold.ttf", /2) 


gameOverSurf=gameOverFont.render('Game Over', True, greyColour) 
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gameOverRect=gameOverSurf .get rect () 
gameOVverRect .midtop=(320，10) 
playSurface.blit (gameOverSurf, gameOverRect) 
pygame .display.flip'() 

time.sleep (5) 

pygame .quit () 

SYS .exit () 


gameOver() 函 数 用 了 一 些 Pygame 命令 来 完成 一 个 简单 的 任务 : 用 大 号 字体 将 Game 
Over 打印 在 屏幕 上 ， 停 留 $ 秒 钟 ， 然 后 退出 Pygame 和 Python 程序。 在 游戏 开始 之 前 就 定 
义 了 结束 函数 ， 这 看 起 来 有 点 奇怪 ， 但 是 所 有 的 函数 都 应 该 在 被 调用 前 定义 。Python 是 不 
会 目 己 执行 gameOver() 函 数 的 ， 直 到 用 户 调 用 该 函数 。 

至 此 程序 的 开头 部 分 已 经 完成 , 接 下 来 进入 主要 部 分 。 该 程序 运行 在 一 个 无 限 循环 (一 
个 永 不 退出 的 while 人 循 坏 〉 中 ， 直 到 蛇 撞 到 了 墙 或 者 自己 才 会 结束 游戏 。 首 先 用 下 面 的 代 
公开 始 主 循环 : 


本 FT Truaee 


没有 其 他 的 比较 条 件 ，Python 会 检测 True 是 否 为 真 。 如 果 True 一 直 为 真 ， 循 环 会 一 
直 进 行 ， 直 到 用 户 调用 gameOver0 函 数 告诉 Python 退出 该 循环 。 


for event in pygame.event .get () : 
if event.type==QUIT: 
pygame .quit () 
SYS .exit () 
elif event .type==KEYDOWN: 
elif event .type==KEYDOWN: 
1f event.key==K RIGHT or event.key==ord('d'): 
changeDirection="'right" 
1if event.key==K LEFT or event.key==ord('a'): 
changeDirection="'left'" 
1f event.key==K UP or event.key==ord('w'): 
changeDirection="'up'" 
if event.key==K DOWN or event.key==ord('s'): 
changeDirection="'down' 
1if event.key==K ESCAPE: 
pygame .event .post (pygame .event .Event (QUIT)) 


for 循环 用 来 检测 按键 等 Pygame 事件 。 

第 1 个 检测 1f event.type == QUIT 告诉 Python 如 果 Pygame 发 出 了 QUIT 信息 ( 当 用 户 
按 下 Esc 键 时 )， 执 行 下 面 缩 进 的 代码 。 之 后 的 两 行 类 似 gameOver0 函 数 ， 通 知 Pygame 和 
Python 程序 结束 并 退出 。 

第 2 个 检测 以 elif 开头 的 行 用 来 检测 Pygame 是 否 发 出 KEYDOWN 事件 , 该 事件 在 用 
户 按 下 键盘 时 产生 。 

KEYDOWN 事件 修改 变量 changeDirection 的 值 ， 该 变量 用 于 控制 蛇 的 运动 方向 。 在 
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本 例 中 提供 了 两 种 控制 蛇 的 方法 ， 即 用 鼠标 或 者 键盘 上 的 W、D、A、S 键 让 由 同上 、 碳 、 
下 、 左 移动 。 程 序 开 始 时 ， 蛇 会 按照 changeDirection 预 设 的 值 同 右 移动 ， 直 到 用 户 按 下 键 
盘 改 变 其 方 问 。 
在 程序 开始 的 初始 化 部 分 有 一 个 叫 direction 的 变量 , 这 个 变量 协同 changeDirection 检 
测 用 户 发 出 的 命令 是 否 有 效 。 蛇 不 应 该 立即 同 后 运动 (如 果 发 生 该 情况 ， 蛇 会 死亡 ， 同 时 
游戏 结束 )。 为 了 防止 这 样 的 情况 发 生 ， 将 用 户 发 出 的 请 求 〈( 保 存在 changeDirection 里 ) 
和 目前 的 方 回 (保存 在 direction 里 ) 进行 比较 ， 如 果 方 同 相 反 ， 忽 略 该 命令 ， 蛇 会 继续 按 
原 方 同 运动 。 这 里 用 下 面 几 行 代码 进行 比较 : 
if changeDirection=="'right' and not direction=="'left"': 
direction=changeDirection 
if changeDirection=="'left"' and not direction=="'right"': 
direction=changeDirection 
if changeDirection=="'up' and not direction=="'down"': 
direction=changeDirection 
if changeDirection=='down"' and not direction=="'up"': 


direction=changeDirection 


这 样 就 傈 证 了 用 户 输入 的 合法 性 ， 蛇 《在 屏 医 上 显示 为 一 系列 块 ) 就 能 够 按照 用 户 的 
输入 移动 。 每 次 转弯 时 ， 蛇 都 会 回 该 方 回 移动 一 小 节 。 每 个 小 节 为 20 像素 ， 用户 可 以 告诉 
Pygame 在 任何 方 同 移 动 一 小 节 。 

if direction=="'right'"': 

snakePosition[0]+=20 
if direction=="'left"': 
snakePosition[0]-=20 
if direction=="'up"': 
snakePosition[1]-=20 
if direction=="'down': 
snakePosition[1]+=20 


snakePosition 为 蛇 头 的 新 位 置 ,程序 开始 处 的 男 一 个 列表 变量 snakeSegments 却 不 是 这 
样 。 该 列表 存储 蛇 身 体 的 位 置 〈 头 部 后 边 )， 随 着 蛇 吃 掉 草 每 导致 长 度 增加 ， 列 表 会 增加 长 
度 同 时 提高 游戏 难度 。 随 厦 游戏 的 进行 ， 避 免 蛇 头 撞 到 吴 体 的 难度 变 大 。 如 果 蛇 头 撞 到 号 
体 ， 蛇 会 死亡 ， 同 时 游戏 结束 。 此 时 用 下 面 的 代码 使 蛇 的 身体 增长 : 


snakeSegments.insert (0,1ist (snakePosition)) 


这 里 用 insert0 方 法 同 snakeSegments 列表 〈( 存 有 蛇 当 前 的 位 置 ) 中 添加 新 项 目 。 每 当 
Python 运行 到 这 一 行 ， 它 惑 会 将 蛇 的 吴 体 增加 一 节 ， 同 时 将 这 一 节 放 在 此 的 头 部 ， 在 玩家 
看 来 蛇 在 增长 。 当 然 ， 用 户 只 和 希望 蛇 吃 到 草 每 时 才 增 长 ， 人 否则 蛇 会 一 直 变 长 。 输 入 下 面 的 
几 行 代码 : 

if snakePosition[0]==raspberryPosition[0] 

and snakePosition[l1]==raspberryPosition[l1]: 


raspberrySpawned=0 
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else: 


snakeSegments .pop () 


第 1 条 迁 语 句 检 查 蛇 头 部 的 xX 和 y 上 华 标 是 否 等 于 草 每 (玩家 的 目标 点 ) 的 坐标 。 如 果 
等 于 ， 该 草 春 就 会 被 蛇 吃 掉 ， 同 时 raspberrySpawned 变量 置 为 0。else 语句 告诉 Python 如 
果 草 每 没有 被 吃 挥 ， 将 snakeSegments 列表 中 最 早 的 项 目 pop 出 来 。 

pop 语句 简单 、 易 用 ， 它 返回 列表 中 末尾 的 项 目 并 从 列表 中 删除 ， 使 列表 缩短 一 项 。 
在 snakeSegments 列表 里 ， 它 使 Python 删 掉 距 离 头 部 最 远 的 一 部 分 。 在 玩家 看 来 ， 蛇 整体 
在 移动 而 不 会 增长 。 实 际 上 ， 它 在 一 端 增加 小 节 ， 在 另 一 端 删除 小 节 。 由 于 有 else 语句 ， 
pop 语句 只 有 在 没 吃 到 草 每 时 执行 。 如 果 吃 到 了 和 草 每 ， 列 表 中 的 最 后 一 项 不 会 被 删 摊 ， 所 
以 蛇 会 增加 一 小 节 。 

现在 , 蛇 就 可 以 通过 吃 草 每 让 目 己 变 长 了 。 但 是 如 果 游 戏 中 只 有 一 个 草 每 会 有 些 无 聊 ， 
所 以 在 蛇 吧 了 一 个 草 每 ， 用 下 面 的 代码 增加 一 个 新 的 草 每 到 游戏 界面 中 : 


if raspberrySpawned==0: 
x=random.randrange (1, 32) 
y=random.randrange (1,24) 
raspberryPosition=[int (x*20),int (y*20)] 


raspberrySpawned=1 


这 部 分 代码 通过 判断 变量 raspberrySpawned 是 否 为 0 来 判断 草 每 是 否 被 吃 扩 了， 如 果 
被 吃 摊 ， 使 用 程序 开始 引入 的 random 模块 获取 一 个 随机 的 位 置 。 然 后 将 这 个 位 置 和 蛇 的 
每 个 小 节 的 长 度 (20 像素 宽 ，20 像素 高 ) 相 乘 来 确定 它 在 游戏 界面 中 的 位 置 。 随 机 地 放置 
草 每 是 很 重要 的 ， 防 止 用 户 预 先知 道 下 一 个 草 符 出 现 的 位 置 。 最 后 将 raspberrySpawned 变 
量 置 1， 以 保证 每 个 时 刻 界 面 上 只 有 一 个 草 拜 。 
现在 有 了 让 蛇 移 动 和 生长 的 代码 ， 包 括 草 每 被 吃 和 新 建 的 操作 《在 游戏 中 称 为 草 每 重 
生 )， 但 是 还 没有 在 界面 上 男 东 西 ， 输 入 下 面 的 代码 : 
playSurface.fill (blackColour) 
for position in snakeSegments: # 男 蛇 (一 系列 方块 ) 
pygame .draw.rect (playSurface,whiteColour,Rect (position[0], 
DOSiELIONnI11 S20 207) 
pygame .draw.rect (playSurface, redColour,Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) # 草 和 莓 
pygame .display.flip() 


这 些 代 人 码 让 Pygame 填充 背景 色 为 黑色 ， 凡 的 头 部 和 映 体 为 白色 ， 章 每 为 红色 。 最 后 
一 行 的 pygame.display.flipO 让 Pygame 更 新 界面 〈 如 果 没 有 这 条 语句 ， 用 户 将 看 不 到 任何 
东西 。 每 次 在 界面 上 男 完 对 象 时 ， 记 得 使 用 pygame.display.flip0 让 用 户 看 到 更 新 )。 

现在 还 没有 涉及 蛇 死 亡 的 代码 。 如 果 游 戏 中 的 角色 永远 死 不 了 ，, 玩家 很 快 会 感到 无 聊 ， 
所 以 用 下 面 的 代码 设置 一 些 让 蛇 死 亡 的 场景 : 


if snakePosition[0]>620 or snakePosition[0]<0: 
gameOver () 


1 snakePosition[1]1>460 or snakePosition[lil]<0: 
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gameOver () 


第 1 个 站 语句 检查 蛇 是 否 已 经 走出 了 界面 的 上 、 下 边界 ,第 2 个 站 语句 检查 蛇 是 否 已 
经 走出 了 左 、 右 边界 。 这 两 种 情况 部 是 蛇 的 末日 ， 触 发 前 面 定 义 的 gameOver(0) 函 数 ， 打 印 
游戏 结束 信息 并 退出 洲 戏 。 如 朱 蛇 头 撞 到 了 目 己 吴 体 的 任何 部 分 ， 也 会 让 蛇 死 亡 ， 所 以 输 
入 下 面 几 行 代 码 : 


for snakeBody in SnakeSedqdments[1:]: 
if snakePosition[0]==snakeBody[0] and 
snakePosition[1]==snakeBody[1]: 


gameOver () 


这 里 的 for 语句 遍历 蛇 的 每 一 小 节 的 位 置 ( 从 列表 的 第 2 项 开始 到 最 后 一 项 )， 同 时 和 
当前 蛇 头 的 位 置 比较 。 这 里 用 snakeSegments[1:] 来 保证 从 列表 的 第 2 项 开始 遍历 。 列 表 的 
第 1 项 为 头 部 位 置 ， 如 果 从 第 1 项 开始 比较 ， 那 么 游戏 一 开始 蛇 就 死亡 了 。 

最 后 ， 只 需要 设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 。 


EpscleckeEaeckt20] 


使 用 IDLE 的 Run Module 选项 或 者 在 终 六 中 输入 python snake.py 来 运行 程序 。 
贪 吃 蛇 snake.py 的 完整 源 代码 如 下 : 


import pygame, sys, time, random 

from pygame.locals import * 

pygame .init () 

fpsClock=pygame .time .Clock () 
playSurface=pygame.display.set mode((640, 480)) 
pygame .display.set caption('Raspberry Snake') 
# 定 义 一 些 颜 色 

redColour=pygame -Color (255, 0, 0) 
blackColour=pygame -Color (0, 0, 0) 
whiteColour=pygame.Color (255, 255, 255) 
greyColour=pygame .Color (150, 150, 150) 

# 初 始 化 程序 中 用 到 的 一 些 变 量 
snakePosition=[100,100] 
snakeSegments=[[100,100],[80,100],[60,100]] 


raspberryPosition=[300,300] # 草 芍 位 置 
raspberrySpawned=1 # 是 否 吃 到 草 每 ，1 为 没有 吃 到 ，0 为 吃 到 
eeclion = Le # 运 动 方 回 


changeDirection=direction 

def gameOver () : 
gameOverFont=pygame.font.Font ('simfang.ttf", 72) 
gameOverSurf=gameOverFont .render('Game Over', True, greyColour) 
gameOverRect=gameOverSurf .get rect () 
gameOverRect .midtop=(320, 10) 
playSurface.blit (gameOverSurf, gameOverRect) 


pygame .display.flip() 
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time.sleep (5) 
pygame .quit () 
SYS .exit () 
while True: 
for event in pygame.event .get () : 
1f event.type==QUIT: 
pygame .quit () 
SYS .exit () 
elif event .type==KEYDOWN: 
if event.key==K RIGHT or event .key==ord('d'): 
changeDirection="'right" 
if event.key==K LEFT or event.key==ord('a'): 
changeDirection="'left'"' 
if event.key==K UP or event.key==ord('w'): 
changeDirection="'up'" 
if event.key==K DOWN or event.key==ord('s'): 
changeDirection="down' 
1f event.key==K ESCAPE.: 
pygame .event .post (pygame .event .Event (QUIT)) 
if changeDirection=="'right"' and not direction=="']eft'"': 
direction=changeDirection 
if changeDirection=="'left"' and not direction=="'right": 
direction=changeDirection 
if changeDirection=='up' and not direction=="'down': 
direction=changeDirection 
if changeDirection=='down"' and not direction=="'up": 
direction=changeDirection 
if direction=="'right'": 
snakePosition[0]+=20 
if direction=="'left"': 
snakePosition[0]-=20 
if direction=="'up": 
snakePosition[1]-=20 
if direction=="'down"': 
snakePosition[1]+=20 
# 将 蛇 的 身体 增加 一 节 ， 同 时 将 这 一 节 放 在 蛇 的 头 部 
snakeSegments.insert (0,1ist (snakePosition)) 
# 检 查 蛇 头 部 的 x 和 y 坐标 是 否 等 于 草 侮 〈 玩 家 的 目标 点 ) 的 坐标 
if snakePosition[0]==raspberryPosition[0] and snakePosition[1]== 
raspberryPosition[1]: 
raspberrySspawned=0 


else: 
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snakeSegments .pop () 
# 在 游戏 界面 中 增加 一 个 新 的 草 春 
1f raspberrySpawned==0: 
x=random.randrange (1, 32) 
y=random.randrange (1,24) 
raspberryPosition = [int (x*20),int (y*20)1] 
raspberrySpawned=1 
playSurface.fill (blackColour) 
for position in snakeSegments: # 男 蛇 (一 系列 方块 ) 
pygame .draw.rect (playSurface,whiteColour,Rect (position[0], 
poOositionlll 5 20 20)) 
# 画 草 春 
pygame .draw.rect (playSurface, redColour, Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) 
pygame .display.flip() 
1f snakepositionl013620 or snakepositiontI0l < 0: 
gameOver () 
i1f snakePosit1ionl113460 or snakePosition1lll1 < 0: 
gameOver () 
for snakeBody in snakeSegments[1:]: 
if snakePosition[0]==snakeBody[0] and snakePosition[1]== 
snakeBody[1]: 
gameOver () 
EpsClocks tuck 


Hn me AN 


相信 玩 过 《雷电 》 的 朋友 都 熟悉 打 飞 机 ， 这 里 将 游戏 做 了 简化 。 飞 机 的 速度 固定 ， 子 
弹 的 速度 固定 ， 基 本 操作 是 通过 键盘 移动 玩家 飞机 ， 敌 机 随机 从 屏幕 上 方 出现 并 匀速 落 到 
下 方 ， 了 弹 从 玩家 飞机 发 出 ， 碰 到 目标 飞机 会 击毁 ， 如 果 目 标 飞 机 生 到 玩家 飞机 ， 则 游戏 
结束 并 显示 分 数 。 飞 机 大 战 游戏 的 运行 效果 如 图 17-8 所 示 。 


17.4.1 ”游戏 角色 


本 洲 戏 中 所 需 的 角色 包括 玩家 飞机 、 政 机 及 子弹 。 用 户 可 以 通过 键盘 移动 玩家 飞机 在 
屏幕 上 的 位 置 来 打 不 同位 置 的 敌 机 , 因此 设计 玩家 类 Player、 敌 机 类 Enemy 和 子弹 类 Bullet 
对 应 3 种 游戏 角色 。 

对 于 玩家 类 Player， 需 要 的 操作 有 射击 和 移动 两 种 ， 移 动 又 分 为 上 、 下 、 左 、 右 4 种 
情况 。 
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ER sa。 二 


AT。 


图 17-8 飞机 大 战 游戏 的 运行 效果 


对 于 敌 机 类 Enemy, 则 比较 简单 , 只 需要 移动 即 可 , 从 屏幕 上 方 出 现 并 移动 到 屏幕 下 方 。 
对 于 子弹 类 Bullet， 与 飞机 相同 ， 仅 需要 以 一 定 的 速度 移动 即 可 。 
玩家 、 子 弹 和 敌 机 都 可 以 写成 一 个 类 ， 继 承 Pygame 的 Sprite 类 ， 实 现 一些 动 画 效 果 


以 及 检测 碰撞 。 


import pygame 

from sys import exit 

from pygame.locals import * 
#from gameRole import * 


import random 


SCREEN WIDTH=480 
SCREEN HEIGHT=800 
TYPE SMALL=]1 

TYPE MIDDLE=2 
TYPE BIG=3 


# 子 弹 类 
class Bullet (pygame.sprite.sprite): # 继 承 Sprite 精灵 类 
def init (self, bullet img, init pos): 
pygame.sprite.sprite. init (self) 
self.image=bullet img 
self.rect=self.image.get rect() 


self.rect .midbottom=1init pos 
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self .speed=10 
def move (self): 
self.rect .top-=self .speed 
# 玩 家 类 
class Player (pygame.sprite.sprite): # 继 承 Sprite 精灵 类 
def init (self, plane img, player rect, init pos) : 
pygame.sprite.sprite. init (self) 
self imge= Tl # 用 来 存储 玩家 对 象 精灵 图 片 的 列表 
for 1 in range(len(player Frect) ) : 
self.image .append (plane img.subsurface (player rect[1]) 


.Convert alpha()) 


self=Tect player Tectltl # 初 始 化 图 片 所 在 的 矩形 

Salitorece EPIeft InilL pas # 初 始 化 矩形 的 左上 角 坐 标 
self.speed=8 # 初 始 化 玩家 速度 ， 这 里 是 一 个 确定 的 值 
self.bullets=pygame .sprite.Group ()  # 玩 家 飞机 所 发 射 的 子弹 的 集合 
self.img index=0 # 玩 家 精灵 图 片 索引 

self.is hit=False # 玩 家 是 否 被 击 中 


def shoot(self, bullet img): 
bullet=Bullet (bullet img, self.rect.midtop) 
self.bullets.add (bullet) 
def moveUp (self): 
if self.rect.top <= 0: 
self.rect.top=0 
else: 
self.rect.top-=self .speed 
def moveDown (self): 
if self.rect.top>=SCREEN HEIGHT-self.rect.height: 
self.rect.top=SCREEN HEIGHT-self.rect.height 
else: 
self.rect.top+=self .speed 
def moveLeft (self): 
if self.rect.left<=0: 
self.rect.1left=0 
else: 
self.rect.1left-—=self .speed 
def moveRight (self): 
if self.rect.left>=SCREEN WIDTH-self.rect.width: 
self.rect.left=SCREEN WIDTH-self.rect.width 
else: 
self.rect.1left+=self .speed 
# 政 机 类 


class Enemy (pygame.sprite.sprite): # 继 承 Sprite 精灵 类 


335 | 


P 项 目 案例 开发 
从 入 门 到 实战 一 爬虫、 游戏 和 机 器 学 习 


def _ lnlt_ _(self, enemy img, enemy down imgs, init pos): 
pygame.sprite.sprite. init (self) 
self.image=enemy img 
self.rect=self.image.get rect () 
self.rect.topleft=init pos 
self.down imgs=enemy down jimgs 
self .speed=2 
self.down index=0 
def move (self): 


self.rect .top+=self .speed 


以 上 设计 了 游戏 中 的 3 个 角色 。 


17.4.2 ”六 戏弄 面 显 示 


在 洲 戏 画面 中 使 用 了 一 些 飞机 、 子 弹 图 像 ， 这 里 使 用 shootpng 文件 (如 图 17-9 所 示 ) 
存储 所 有 飞机 、 子 弹 、 爆 炸 等 图 像 ， 在 程序 中 需要 分 割 出 来 显示 。 当 然 ， 可 以 用 图 像 处 理 
软件 分 解 成 一 个 个 独立 文件 ， 这 样 处 理 后 开发 程序 简单 些 。 


RS ，， 
守 类 Ww WR CR 


图 17-9 飞机 大 战 游戏 的 图 像 文 件 shoot.png 


所 有 的 飞机 都 在 shoot.png 图 片 中 ,在 游戏 中 显示 的 元 素 ( 包 括 飞 机 、 子 弹 等 ) 在 Pygame 
中 都 是 一 个 surface， 这 时 可 以 利用 Pygame 提供 的 subsurface0 方 法 ， 首 先 载 入 一 张大 图 ， 
然后 调用 subsurface() 方 法 选取 其 中 的 一 小 部 分 生成 一 个 新 的 surface。 


# 载 入 飞机 图 片 

plane img=pygame.image.load('resources/image/shoot.png') 

# 选 择 飞 机 在 大 图 中 的 位 置 ， 并 生成 subsurface， 然 后 初始 化 飞机 开始 的 位 置 
player rect=pygame.Rect (0, 99, 102, 1206) 

playerl=plane img.subsurface (player rect) # 获 取 飞 机 图 片 
player pos=[200, 600] 

screen.blit (playerl, player pos) # 绘 制 飞 机 
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初始 化 游戏 并 根据 设置 好 的 大 小 生成 游戏 窗口 ; 载 入 游戏 音乐 、 背 景 图 片 background 
.png、 游 戏 结束 国 面 gameoverpng 以 及 飞机 和 子弹 图 像 shoot.png; 设置 相关 参数 。 最 后 定义 
存储 敌人 的 飞机 精灵 组 enemiesl 和 用 来 泻 染 击毁 精灵 动画 的 爆炸 飞机 精灵 组 enemies_ down。 


# 初 始 化 游戏 

pygame .init () 

screen=pygame.display.set mode( (SCREEN WIDTH, SCREEN HEIGHT)) 
pygame .display.set caption(' 飞 机 大 战 ') 


# 载 入 游戏 音乐 

bullet sound=pygame.mixer.Sound('resources/sound/bullet .wav') 

enemyl down sound=pygame.mixer.Sound('resources/sound/enemyl] down .wav') 
game over sound=pygame .mixer.Sound('resources/sound/game over.wav') 
bullet sound.set volume (0.3) 

enemyl down sound.set volume (0.3) 

game over sound.set volume (0.3) 

pygame .mixer.music.load('resources/sound/game music.wav') 

pygame .mixer.music.play(-l1, 0.0) 


pygame .mixer.music.set volume (0.25) 


background=pygame .image.load('resources/image/background.png') 
-Conmvert(} # 载 入 背景 图 
game over=pygame.image.load('resources/image/gameover .png') 


# 载 入 游戏 结束 图 gameover .png 


filename="'resources/image/shoot .png' 


plane img=pygame.image.1load (filename) # 载 入 飞机 和 子弹 图 shoot .png 

# 设 置 玩家 相关 参数 

player rect=[] 

player rect.append (pygame.Rect (0, 99, 102, 126)) # 玩 家 精灵 图 片区 域 


player rect.append (pygame.Rect (162，360，102，126) ) 

player rect.append (pygame.Rect (165, 234, 102, 126)) # 玩 家 爆炸 精灵 图 片区 域 
player rect.append (pygame.Rect (330, 624，102，126) ) 

player rect.append (pygame .Rect (330, 498, 102, 126)) 

player rect.append (pygame .Rect (432, 624, 102, 1206)) 

player pos=[200, 600] 

player=Player (plane img, player rect, player pos) 


# 定 义 子 弹 对 象 使 用 的 surface 相关 参数 
bullet rect=pygame.Rect (1004, 987, 9, 21) 


bullet img=plane img.subsurface (bullet rect) 


# 定 义 敌 机 对 象 使 用 的 surface 相关 参数 
enemyl1 rect=pygame.Rect (334, 612, S57, 43) 


enemyl img=plane img.subsurface (enemyl rect) 
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enemyl down imgs=[] 


enemyl down imgs.append (plane img.subsurface (pygame.Rect (267, 347, 57, 


43) ) ) 

enemyl down lmgs .append (plane img.subsurface (pygame.Rect (873, 697, 57, 
43})) 

enemyl down imgs.append (plane img.subsurface (pygame.Rect (267, 296, 57, 
号 本 

enemyl down Imgs .append (plane img.subsurface (pygame.Rect (930, 697, 57, 
23)) 

enemiesl=pygame .sprite.Group() # 存 储 和 天 人 的 飞机 


enemies down=pygame.sprite.Group() # 存 储 被 击毁 的 飞机 ， 用 来 泻 染 击毁 精灵 动画 
shoot frequency=0 

enemy frequency=0 

player down index=16 

score=0 

clock=pygame .time.Clock () 


running=True 


17.4.3 ”游戏 的 远 辑 实现 


下 和 面 进入 游戏 主 循环 ， 在 主 循环 中 进行 了 以 下 操作 : 

@ 处 理 键盘 输入 的 事件 ， 增 加 游戏 操作 交互 

处 理 键 盘 输 入 的 事件 指 上 、 下 、 左 、 厂 按键 操作 ， 增 加 游戏 操作 交互 指 玩家 飞机 的 上 、 
下 、 左 、 右 移动 。 


key pressed=pygame.key.get Pressed () 
# 若 玩家 被 击 中 ， 则 无 效 
i1f not plaver 1s hit- 
if key pressed[K w] or key pressed[K UP]: “ # 处 理 键盘 事件 〈 移 动 飞 机 的 位 置 ) 
player.moveUp () 
if key pressed[K s] or key pressed[K DOWN] :# 处 理 键盘 事件 〈 移 动 飞机 的 位 置 ) 
player .moveDown () 
if key pressed[K a] or key pressed[K LEFT] :# 处 理 键盘 事件 〈 移 动 飞 机 的 位 置 ) 
player.moveLeft () 
if key pressed[K d] or key pressed[K RIGHT] : # 处 理 键盘 事件 (移动 飞机 的 位 置 ) 
player.moveRight () 


@ 处 理子 弹 
这 里 控制 发 射 子弹 的 频率 并 发 射 子弹 , 移动 已 发 射 过 的 子弹 , 大 超出 窗口 范围 则 删除 。 
# 控 制 发 射 子弹 的 频率 并 发 射 子弹 


if not player.is hit:  #〈1) 判断 玩家 飞机 没有 被 击 中 
if shoot frequency®%15==0: 
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bullet sound.play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot Freqiency=0 
# 移 动 已 发 射 过 的 子弹 ， 大 超出 窗口 范围 则 删除 
for bullet in player.bullets: 


bullet .move () # (2) 以 固定 速度 移动 子弹 
if bullet.rect.bottom<0: # (3) 子弹 移动 出 屏幕 后 删除 子弹 
plLayer.bullets .remove (bullet)  # 删 除 子弹 
@ 敌 机 处 理 


敌 机 需要 在 界面 上 方 随机 产生 ， 并 以 一 定 的 速度 癌 下 移动 ， 详 细 步 骤 如 下 : 
(1) 生成 敌 机 ， 需 要 控制 生成 频率 。 

(2) 移动 敌 机 。 

(3) 敌 机 与 玩家 飞机 碰撞 效果 的 处 理 。 

(4) 移出 屏幕 后 删除 敌 机 。 

($5) 敌 机 被 子弹 击 中 效果 的 处 理 。 

@ 得 分 显示 

在 游戏 界面 的 固定 位 置 显 示 消 灭 了 多 少 目标 敌 机 。 


score font=pydame .font .Font (None, 36) 

score text=score font.render(str(score), True, (128, 128, 128))text rect 
=Sscore text.get rect () 

text rect.topleft=[10, 10] 

screen.blit (score text, EexEeeesEe 


游戏 主 循环 的 完整 代码 如 下 : 


while running: 
clock.tick (60) # 控 制 游戏 最 大 帧 率 为 60 
# 控 制 发 射 子弹 的 频率 并 发 射 子弹 
if not player.1is hit: 
if shoot frequency % 15==0: 
bullet sound.play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot frequency=0 
# 移 动 子弹 ， 知 超出 窗口 范围 则 删除 
for bullet in player.bullets: 
bullet .move () 
if bullet.rect.-.bottom<0: 
player.bullets.remove (bullet) 


# 生 成 敌 机 
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if enemy frequency %$ 50==0: # (1) 生成 敌 机 ， 需 要 控制 生成 频率 
enemyl pos=[random.randint (0, SCREEN WIDTH - enemyl rect.width), 0] 
enemyl=Enemy (enemyl img, enemyl] down imgs, enemyl pos) 
enemiesl .add (enemy1) 

enemy frequency+=1 

if enemy frequency>=100: 


enemy frequency=0 


# 移 动 敌 机 ， 大 超出 窗口 范围 则 删除 


for enemy in enemlesl : 


enemy .move () # (2) 移动 敌 机 
# 判 断 玩 家 是 否 被 击 中 
if pygame.sprite.collide circlel(enemy, player): 
#(3) 政 机 与 玩家 飞机 碰撞 效果 的 处 理 


enemies down.add (enemy) 

enemiesl .remove (enemy) 

player.is hit=True 

game over sound.play() 

break 

if enemy.rect.top > SCREEN HEIGHT: #1(4) 移出 屏幕 后 删除 飞机 

enemlesl .remoVe (enemy) 
# (5) 敌 机 被 子弹 击 中 效果 的 处 理 
# 将 被 击 中 的 敌 机 对 象 添加 到 击毁 敌 机 Group 中 ， 用 来 演 染 击毁 动画 
enemlesl down =Pyqame .SPrlite .groupcollide (enemies]1, player.bullets, 1, 1) 
for enemy down in enemlesl down: 


enemies down.add (enemy down) 


# 绘 制 背景 
eresnv EDEL 


screen.blit (background, (0, 0)) 


# 绘 制 玩家 飞机 
1If not player.1is hit: 


screen.blit (player.image[player.img index], player.rect) 


# 更 换 图 片 索 引 使 飞机 有 动画 效果 

player.img index=shoot frequency Ff a 
else: 

player.img index=player down index FS 


screen.blit (player.image[player.img index], player.rect) 
player down index+=1 
if player down index>47: 

running=False 


# 绘 制 击毁 动画 


for enemy down in enemies down: 
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if enemy down.down index==0: 
enemyl down sound.playl() 
if enemy down.down index>7: 
enemies down.remove (enemy down) 
score+=1000 
continue 
screen.blit (enemy down.down imgs[enemy down.down index // 2], 
enemy down.rect) 
enemy down.down index+=1 
# 绘 制 子弹 和 敌 机 
player.bullets .draw (screen) 
enemiesl.draw (screen) 
# 绘 制 得 分 
score font=pygame.font.Font (None, 36) 
score text=score font.render(str(score), True, (128, 128, 128)) 
text rect=score text.get rect () 
text rect.topleft=[10, 10] 
screen.blit (score text, text rect) 
# 更 新 屏幕 
pygame .display.update() 
for event in pygame.event .get () : 
if event .type==pygame .QUIT : 
pygame .quit () 
exitl) 
# 监 听 键 盘 事 件 
key Pressed=pygame .key-get pressed() 
# 铬 玩家 被 击 中 ， 则 无 效 
if not player.1is hit: 
J key pressedlk wl or key pressedlk UP]: 
player .moveUp () 
if key pressed[K s] or key pressed[K DOWN] : 
player .moveDown () 
if key pressed[K al or key pressed[K LEFT]: 
player .moveLeft () 
if key pressed[K d] or key pressed[K RIGHT] : 
player.moveRight () 
font=pygame.font.Font (None, 48) 
Eext=EonE render( Secore: TIStriscorel. True 2 0 000) 
EentsTecGe Eext IE racel, 
text rect.centerx=screen.get Frect () .centerx 
text rect.centery=screen.get rect() .centery+24 
screen.blit (game over, (0, 0)) 
screen.blit (text, text rect) 
while 1: 


for event in pygame.event .get () : 
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if event .type==pygame .QUIT: 


pygame .quit () 
exit () 
pygame .display.update() 


目前 基本 实现 了 玩家 移动 并 发 射 子 弹 、 随 机 生成 敌 机 、 击 中 敌 机 并 爆炸 、 玩 家 飞机 被 
击毁 、 痛 景 音乐 及 音效 、 游 戏 结束 并 显示 分 数 这 几 项 功能 ， 已 经 是 一 个 简单 、 可 玩 的 游戏 。 
整个 游戏 的 实现 不 到 300 行 代码 ， 可 以 看 出 Python 代码 是 多 么 简洁 和 高 效 。 
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18.1 文本 分 类 功能 介绍 


对 于 分 类 问题 ， 其 实 大 家 都 很 熟悉 ， 说 每 个 人 每 天 都 在 执行 分 类 操作 
一 点 也 不 夸张 ， 只 是 大 家 没有 意识 到 罢了 。 例 如 ， 当 看 到 一 个 陌生 人 , 脑 “ 
子 里 会 下 意识 地 判断 是 男 是 女 ; 走 在 路 上 , 可 能 经 常会 对 身 旁 的 朋友 说 “这 视频 计 解 
个 人 一 看 就 很 有 钱 ”“ 这 个 人 看 着 很 谦和 ”之 类 的 话 ， 其 实 这 就 是 一 种 分 类 操作 ， 也 就 是 根 
据 这 个 人 身上 的 某 些 特征 做 出 的 一 个 推断 。 

文本 分 类 和 其 他 分 类 本 质 上 是 一 样 的 ， 只 不 过 分 类 的 对 象 是 文本 。 文 本 分 类 问题 是 根据 
文本 的 特征 将 其 分 到 预先 设 定好 的 类 别 中 ,类 别 可 以 是 两 类 ,也 可 以 是 更 多 的 类 别 。 文 本 数据 
是 互联 网 时 代 的 一 种 最 常见 的 数据 形式 ， 新 闻 报 道 、 电 子 邮 件 、 网 页 、 评 论 留 言 、 博 客 文章 、 
学 术 论文 等 都 是 常见 的 文本 数据 类 型 , 文本 分 类 问题 所 采用 的 类 别 划分 往往 也 会 根据 目的 不 同 
而 有 较 大 差别 。 例如， 根据 文本 内 容 可 以 有 “政治 ”“ 经 济 ”“ 体 育 ” 等 不 同类 别 ， 根据 应 用 目 
的 要 求 ， 在 检测 垃圾 邮件 时 可 以 有 “垃圾 邮件 ”和 “ 非 垃圾 邮件 ”根据 文本 特点 ， 在 做 情感 
分 析 时 可 以 有 “积极 情感 文本 ”和 “消极 情感 文本 ”。 可 见 ， 文 本 分 类 的 应 用 非常 广泛 。 

常用 的 文本 分 类 算法 有 朴素 贝 叶 斯 算法 、 支 持 向 量 机 算法 、 决 策 树 、KNN 最 近邻 算法 
等 。 KNN 最 近邻 算法 的 原理 最 简单 ， 但 是 分 类 精度 一 般 ， 速 度 很 慢 ; 朴素 贝 叶 斯 算法 对 于 
短文 本 分 类 效果 最 好 ， 精 度 很 高 ， 支 持 向 量 机 算法 的 优势 是 支持 线性 不 可 分 的 情况 ， 在 精 
度 上 取 中 。 本 章 以 朴素 贝 叶 斯 算法 为 例 讲解 文本 分 类 的 一 般 过 程 ， 并 以 垃圾 邮件 过 滤 作为 
朴素 贝 叶 斯 算法 的 一 个 应 用 案例 进行 测试 。 


18.2 ”程序 设计 的 思路 


文本 分 类 主要 有 3 个 步 又 : 


PP, 项 目 案 例 开 发 
从 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


@ 文本 的 表达 

这 个 阶段 的 主要 任务 是 将 文档 转变 成 天 量 形式 ， 和 常用 且 最 简单 的 就 是 词 集 模型 。 其 基 
本 思想 是 假定 对 于 一 个 文档 忽略 其 词 序 、 语 法 和 句法 等 要 素 ， 将 文档 仅仅 看 作 是 奋 干 词汇 
的 集合 ， 而 文档 中 每 个 单词 的 出 现 都 是 独立 的 ， 不 依赖 于 其 他 词汇 的 出 现 。 简 单 来 说 ， 就 
是 将 每 篇 文档 都 看 成 一 个 词汇 集合 ， 然 后 看 这 个 集合 里 出 现 了 什么 词汇 ， 将 其 分 类 。 例 如 
有 以 下 两 个 文档 。 

文档 一 : Bob likes to play basketball,Jim likes too. 

文档 二 : Bob also likes to play football games. 

基于 这 两 个 文档 ， 先 构造 一 个 词汇 表 : 

wordList={"Bob","]ikes", "to", "play", "basketball™, "Jim", "too", "also", 

“Tootball” “qames”} 

可 以 看 到 ， 这 个 词汇 表 由 10 个 不 同 的 单词 组 成 ， 利 用 单词 在 词汇 表 中 的 索引 ， 上 面 
两 个 文档 都 可 以 用 一 个 10 维 癌 量 表示 , 同 量 中 的 每 个 元 素 表示 词汇 表 中 的 相应 单词 在 文档 
中 是 否 出 现 ， 出 现 为 1， 不 出 现 为 0。 

文档 一 : [1,1,1,1,1,1,1,0,0,0] 

文档 二 : [1,1,1,1,0,0,0,1,1,1] 

@ 分 类 器 的 选择 与 训练 

这 个 阶段 是 文本 分 类 的 关键 步骤 ， 使 用 的 分 类 算法 不 同 ， 有 具体 步骤 也 不 同 ， 这 里 使 用 
朴 系 贝 叶 斯 算法 进行 文本 分 类 ， 具 体 将 在 18.3 节 详 细 介 绍 。 

@@ 分 类 结果 的 评价 

机 器 学 习 领 域 的 算法 评估 常用 的 评价 指标 如 下 : 

错 分 率 = 所 有 分 类 错误 的 记录 数 /测试 集中 的 记录 总 数 

准确 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /被 识别 为 该 分 类 的 记录 数 

名 回 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /测试 集中 该 分 类 的 记录 总 数 

F1-score=2(; 准 确 率 x 召 回 率 X/( 准 确 率 + 召 回 率 ) 


18.3 ”关键 技术 
18.3.1 由 叶 斯 算法 的 理论 基础 


@ 条 件 概率 

假设 一 个 盒子 里 装 了 9 个 小 球 ， 如 图 18-1 所 示 ， 其 中 4 个 黑色 的 、5 个 白色 的 ， 如 果 
从 盒子 里 随机 取 一 个 小 球 ， 那 么 是 黑色 小 球 的 可 能 性 有 多 大 ? 由 于 取 小 球 有 9 种 可 能 ， 其 
中 4 种 为 黑色 , 所 以 取出 黑色 小 球 的 概率 为 4/9。 那么 取出 白色 小 球 的 概率 又 会 是 多 少 呢 ? 
很 显然 ， 是 5/9。 如 果 用 P(black) 表 示 取 黑色 小 球 的 概率 ， 其 概率 值 等 于 黑色 小 球 的 数量 除 
以 小 球 总 数 。 
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图 18-1 一 个 装 有 9 个 小 球 的 盒子 
如 果 将 9 个 小 球 分 开放 在 两 个 盒子 中 ,如 图 18-2 所 示 ， 那 么 上 述 概率 应 该 如 何 计算 ? 


sfs ss 


A 禽 B 仿 
图 18-2 ”将 9 个 小 球 分 别 放 在 两 个 盒子 中 


将 9 个 小 球 如 图 18-2 所 示 放 在 两 个 盒子 中 ， 要 计算 P(black) 或 者 PC(white)， 事 先 得 知 
小 球 所 在 盒子 的 信息 会 不 会 改变 结果 ? 假设 从 A 盒 中 取出 黑色 小 球 的 概率 为 P(black|A 
盒 )， 即 “在 已 知 小 球 取 自 A 盒 的 情况 下 取出 黑色 小 球 的 概率 ”， 容 易 得 到 从 A 盒 中 取出 黑 
色 小 球 的 概率 P(black|A 盒 ) 为 /4， 这 就 是 所 谓 的 条 件 概 率 。 
条 件 概率 的 定义 :已 知事 件 B 发 生 的 条 件 下 事件 A 发 生 的 概率 称 为 事件 A 关于 事件 B 
的 条 件 概率 ， 记 为 PLAIB)。 对 于 任意 事件 A 和 B， 知 P(B 六 0， 则 “在 事件 B 发 生 的 条 件 
P(AB) 


下 事件 A 发 生 的 条 件 概 率 ” 记 为 P(A|IB)， 定 义 为 全 
那么 ， 对 于 小 球 这 个 例子 来 说 ， 依 据 条 件 概率 的 定义 ，P(blackIA 盒 )=P(black and A 
盒 MP(A 盒 )。 


下 面 来 看 上 述 公式 是 否 合理 。P(black and A 盒 ) 表 示 取 出 A 盒 中 黑色 小 球 的 概率 , 用 A 
盒 中 的 黑色 小 球 数量 除 以 小 球 总 数 可 得 ， 即 1/9; P(A 盒 ) 表 示 从 A 盒 中 取 小 球 的 可 能 性 ， 
即 用 A 盒 中 的 小 球 数量 除 以 小 球 总 数 ,， 即 4/9。 于 是 有 P(black|A 盒 )=P(black and A 盒 )/P(A 
盒 )=(1/9)/(4/9)=1/4， 结 论 与 前 面 分析 得 到 的 结果 相同 ， 说 明 公 式 完 全 合理 。 

@ 全 概率 公式 

若 事 件 组 (A1,A,…,An) 满 足以 下 关系 : 

(1)Ai(i=1,2,…,n) 两 两 互 不 ， 且 P(A;)>0。 
(2) 3? A, =Q，Q 为 样本 空间 。 
则 称 事件 组 (A,A>……,Ao 是 样本 空间 Q 的 一 个 划分 。 
全 概率 公式 : 设 (Ai,A2,…,An) 是 样本 空间 Q 的 一 个 划分 ，B 为 任 一 事件 ， 则 有 
P(B) = >_P(A;)P(BIA.,) 


1=] 
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人 贝 叶 斯 公式 
设 (Al,A2,…,An) 是 样本 空间 QQ 的 一 个 划分 ， B 为 任 一 事件 ， 则 有 : 


P(A,B) P(A)P(BIA,) 
人 yP(A )PGB |A.,) 


二 


P(A, |B) = 


上 式 中 的 A; 常 被 视 为 导致 试验 结果 B 发 生 的 “原因 ”，P(A;) (i=1,2,…*,n) 表示 各 种 
原因 发 生 的 可 能 性 大 小 ， 故 称 先 验 概率 ，P(Aj|B) (=1.2…n) 则 反映 当 试 验 产 生 了 结果 B 
之 后 再 对 各 种 原因 概率 的 新 认识 ， 故 称 后 验 概率 。 


18.3.2 ”朴素 由 叶 斯 分 类 


@ 朴素 贝 叶 斯 分 类 的 原理 

朴素 贝 叶 斯 分 类 基于 条 件 概 率 、 贝 叶 斯 公式 和 独立 性 假设 原则 。 

基于 概率 论 的 方法 告诉 我 们 ， 当 只 有 两 种 分 类 时 : 

如 果 P1(x,y)>P2(x,y)， 那 么 分 入 类 别 1; 

如 果 P2(x,y)>P1(x,y)， 那 么 分 入 类 别 2。 

这 里 提 到 的 Pl1(x,y)、P2(x,y) 是 一 种 简化 描述 ， 分 别 表 示 P(cilx,y) 和 P(eczlx,y)， 这 些 符 
号 表示 的 意义 可 以 这 样 理解 ,给 定 某 个 由 x、y 两 个 特征 表示 的 数据 点 ,那么 该 数据 点 是 类 
别 ci 的 概率 是 多 少 ? 是 类 别 cz 的 概率 又 是 多 少 ? 应 用 贝 叶 斯 定理 可 得 : 

P(c |x,y) = P(x,y|c:;)P(c;) 


p(X,y) 

从 而 可 以 定义 贝 叶 斯 分 类 准则 如 下 : 

。 如 果 p(cilx,y)> p(czlx,y)， 那 么 属于 类 别 cl; 

。 如 果 p(cilx,y)<p(czlx,y)， 那 么 属于 类 别 cz。 

这 样 ， 使 用 贝 叶 斯 公式 可 以 通过 计算 已 知 的 3 个 概率 值 来 得 到 未 知 的 概率 值 。 如 果 仅 
仅 为 了 比较 P(cilx, y) 和 P(czlx, y) 的 大 小 ， 因 为 分 母 相 同 ， 只 需要 已 知 分 子 上 的 两 个 概率 即 
可 。 这 里 还 有 一 个 假设 ， 就 是 基于 特征 条 件 独立 的 假设 ， 也 就 是 上 面 说 到 的 数据 点 的 两 个 
特征 x 和 y 相互 独立 ， 不 会 相互 影响 ， 因 此 可 以 将 P(x,ylci) 展 开 成 独立 事件 概率 相 乘 的 形 
式 ， 则 有 : 

P(x,ylci)=P(x|ci)P(ylci) 


当然 ， 对 于 多 个 特征 条 件 的 情况 ， 上 式 仍然 成 立 ， 这 样 计算 概率 就 简单 多 了 。 
@ 朴素 贝 叶 斯 分 类 的 定义 


扩展 到 一 般 情 况 ， 朴 素 贝 叶 斯 分 类 的 正式 定义 如 下 : 

(1) 设 x={al, az ,am} 为 一 个 竺 分 类 项 , ai 为 x 的 一 个 特征 属性 , 有 类 别 C={yi, yz …， 
yn}。 

(2) 计算 p(yllx)，Pp(yz|x)，…，Pp(ynlx)。 

(3) 如 条 p(yx|x)=max {p(y1|X), p(y2|X),…, p(yn|X)}， 则 xsyk。 

现在 的 关键 是 如 何 计算 第 (2) 步 中 的 各 个 条 件 概 率 ， 可 以 这 么 做 : 

Q 找到 一 个 已 知 分 类 的 竺 分 类 项 集合 ， 这 个 集合 称 为 训练 样本 集 。 
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@ 统计 得 到 各 类 别 下 各 个 特征 属性 的 条 件 概 率 估计 , 即 P(aily1), P(azly1),…, P(amlyi); 
P(aily2), P(azly2), **, P(amly2); …; P(allyao)，P(azjya)，…， 了 P(am|yn)。 
@) 如 果 各 个 特征 属性 是 条 件 独立 的 ， 则 根据 贝 叶 斯 公式 有 如 下 推导 : 
P(y; | x) a P(x | 3 )P(y;) 
p(X) 
因为 分 母 对 于 所 有 类 别 相同 ， 所 以 只 要 将 分 子 最 大 化 即 可 。 又 因为 各 特征 属性 是 条 件 
独立 的 ， 所 以 有 : 


P(x |y,)P(y,) =P(ai |y,)P(asly,)4 Pa |y,)P(y,) =P(y)T [PGa, |y,) 


全 朴素 贝 叶 斯 分 类 的 流程 
根据 上 述 分 机， 朴素 贝 叶 斯 分 类 的 流程 可 以 用 图 18-3 表示 。 


准备 阶段 


获取 训练 样本 


对 每 个 类 别 计算 
P(y',) 


分 类 克 
训练 阶段 


对 每 个 特征 属性 计算 
所 有 划分 的 条 件 概率 


以 P(x|y;)P(y;) 最 大 


4 / ”对 每 个 类 别 计算 
项 作为 x 所 属 类 别 P(x|y,; )P(y') 


应 用 阶段 


图 18-3 ”朴素 贝 叶 斯 分 类 流程 


可 以 看 到 ， 整 个 朴素 贝 叶 斯 分 类 分 为 3 个 阶段 。 

(1) 准备 阶段 : 这 个 阶段 为 朴素 贝 叶 斯 分 类 做 必要 的 准备 ， 主 要 工作 是 根据 具体 应 用 
情况 确定 特征 属性 ， 并 对 每 个 特征 属性 进行 适当 划分 ， 然 后 由 人 工 对 一 部 分 待 分 类 项 进行 
分 类 ， 形 成 训练 样本 集合 。 这 一 阶段 的 输入 是 所 有 符 分 类 数据 ， 输 出 是 特征 属性 和 训练 样 
本 集合 。 这 一 阶段 是 整个 朴素 贝 叶 斯 分 类 中 非常 重要 的 一 个 阶段 ， 也 是 唯一 需要 人 工 完 成 
的 阶段 ， 其 质量 对 整个 过 程 有 重要 影响 ， 分 类 需 的 质量 在 很 大 程度 上 由 特征 属性 、 特 征 属 
性 划分 及 训练 样本 质量 决定 。 

(2) 分 类 器 训练 阶段 ， 这 个 阶段 就 是 生成 分 类 占 ， 主 要 工作 是 计算 每 个 类 别 在 训练 样 
本 中 的 出 现 概率 及 每 个 特征 属性 划分 对 每 个 类 别 的 条 件 概 率 估 计 ， 并 将 结果 记录 。 其 输入 


347 | 


PP 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


是 特征 属性 和 训练 样本 ， 输 出 是 分 类 占 。 这 一 阶段 是 目 动 化 阶段 ， 根 据 前 面 讨论 的 公式 可 
以 由 程序 自动 计算 完成 。 

(3) 应 用 阶段 ， 这 个 阶段 的 任务 是 使 用 分 类 器 对 行 分 类 项 进行 分 类 ， 其 输入 是 分 类 器 
和 符 分 类 项 ， 输 出 是 符 分 类 项 与 类 别 的 映射 关系。 这 一 阶段 也 是 目 动 化 阶段 ， 由 程序 完成 。 


18.3.3 ”使 用 Python 进行 文本 分 类 


在 文本 分 关中 ， 要 从 文本 中 获取 特征 ， 需 要 先 拆 分 文本 ， 以 一 封 电子 邮件 为 例 ， 电 子 
邮件 中 的 条 些 元 系 构 成 特征 。 我 们 可 以 解析 得 到 文本 中 的 词 ， 并 把 每 个 词 作为 一 个 特征 ， 
而 每 个 词 是 否 出 现 作为 该 特征 的 值 ， 然 后 将 每 一 个 文本 表示 为 一 个 词 条 问 量 ， 束 是 前 面 所 
到 的 词 集 模型 。 每 一 个 文本 的 词 条 回 量 的 大 小 与 词汇 表 中 词 的 数目 一 致 。 

假设 特征 之 间 相 互 独立 。 所 谓 独 立 指 的 是 统计 意义 上 的 独立 ， 即 一 个 特征 或 者 单词 出 
现 的 可 能 性 与 它 和 其 他 单词 相 邻 没有 关系 ， 比 如 说 ,“ 今 天 天 气 真 好 ! 中 的 “今天 ”和 “天 
气 ” 出 现 的 概率 与 这 两 个 词 相 邻 没 有 任何 关系 。 这 个 假设 正 是 朴素 贝 叶 斯 分 类 右 中 “ 杆 素 ” 
一 词 的 含义 。 杆 素 贝 叶 斯 分 类 右 中 的 为 一 个 假设 是 每 个 特征 同等 午 要 。 


18.4 ”程序 设计 的 步 又 


掌握 了 上 和 面 的 基本 理论 ， 就 可 以 开局 文本 分 类 之 旅 了 ， 本 节 以 判断 留言 板 的 留言 是 否 
为 侮辱 性 言论 为 例 ， 详 细 讲 解 使 用 朴素 贝 叶 斯 算法 进行 文本 分 类 的 过 程 。 

问题 概述 : 构建 一 个 快速 过 滤器 来 屏蔽 在 线 社 区 留言 板 上 的 侮辱 性 言论 。 如 果 某 条 留 
言 中 出 现 了 负面 或 者 侮辱 性 的 词汇 ， 就 将 该 留言 标识 为 内 容 不 当 。 对 此 问题 建立 两 个 类 
别 一 一 侮辱 类 和 非 侮辱 类 ， 分 别 用 1 和 0 表示。 

现在 正式 开始 ， 首 先 创建 一 个 名 为 Nbayes.py 的 新 文件 ， 然 后 依次 将 程序 清单 添加 到 
文件 中 。 


18.4.1 ”收集 训练 数据 ER 


为 了 将 主要 精力 集中 在 分 类 算法 本 身 ， 直 接 用 简单 的 英文 语 料 作为 数 ” 固 站 

据 集 。 在 实际 应 用 中 ， 可 以 通过 疏 虫 或 其 他 途径 获取 真实 数据 。 视频 讲解 
def loadDataset () : 

postingList=[['my',"'dog','has','flea', 'problems', 'help', 'please'], 


mvie no tke Nm or oog pa tum ls 
人 
[L'stop’, "posting’', stupridQ "worthlass'; "garbage’l, 

[mr ca date me ato Hon to "otop "him" |. 


[ET Do worthless ogg Go "stupzd ll 
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classVec=[0,1,0,1,0,1] #1 代表 侮辱 性 言论 ，0 代表 正常 言论 
return postingList,classVec 
loadDataSet() 函 数 直 接 用 模拟 的 6 个 已 分 词 的 小 文档 和 对 应 的 6 个 类 别 标 签 作 为 训练 
数据 。 该 函数 返回 两 个 列表 ， 其 中 postingList 表示 已 分 词 的 文档 列表 ，classVec 表示 文档 
对 应 的 类 别 列表 。 


18.4.2 ”准备 数据 


有 了 数据 集 ， 接 下 来 需要 从 数据 集 生成 文本 的 结构 化 描述 方法 ， 即 回 量 空间 模型 ， 把 
文本 表示 为 一 个 辐 量 ， 把 回 量 的 每 个 特征 表示 为 文本 中 出 现 的 词 ， 这 里 用 前 和 面 所 a 到 的 词 集 
模型 ， 站 先 志 历 训 练 集中 的 所 有 文本 ， 生 成 词汇 表 。 


def vocadbbparstildatageth: 


vocabSet=set ([]) # 使 用 set 创建 不 重复 的 词汇 集 
for document in dataset.: 
vocabSet=vocabSet |set (document) # 创 建 两 个 集合 的 并 集 


TEEUIN L113t (vocabset) 


vocabList(dataSet) 芳 数 的 参数 dataSet 为 文档 集 的 单词 列表 ， 即 loadDataSetO 函 数 的 
postingList 返回 值 。 该 函数 根据 文档 数据 集 dataSet 创建 一 个 包含 在 所 有 文档 中 不 重复 出 现 
的 单词 列表 ， 为 此 使 用 Python 的 set 数据 类 型 。 首 先 创建 一 个 空 的 集合 ， 然 后 将 每 个 文档 
的 词 集合 加 入 该 集合 中 ， 操 作 符 “|” 表示 求 两 个 集合 的 并 集 。 

下 面 根据 词汇 表 生 成 每 篇 文档 的 词 集 模型 表示 ， 即 词 同 量 。 

def setOfWordsVec (vocabList,1inputText): 

textVec=[0]*len (vocabLi st) # 创 建 一 个 所 有 元 素 都 为 0 的 向 量 
# 遍 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 令 文 档 辐 量 中 的 对 应 值 为 1 
for word in inputText: 

if word in vocabList: 


textveclvocabbist indextiuordyl=1 
return textVec 


setOfWordsVec(vocabList,inputText) 函 数 有 两 个 参数 ，vocabList 表示 已 知 的 词汇 表 ， 
inputText 表示 茶 一 文档 的 单词 列表 ， 图 数 返 回 值 textVec 为 文档 inputText 的 词 回 量 ， 回 量 
中 的 每 一 元 素 为 0 或 1, 表示 词汇 表 中 的 元 素 在 文档 中 是 否 出 现 , 没有 出 现 为 0, 出 现 为 1。 
器 量 的 长 度 与 词汇 表 的 长 度 相 同 。 该 函数 首先 创建 一 个 和 词汇 表 一 样 长 的 句 量 ， 癌 量 元 素 
全 部 为 0， 接 痢 过 历 文 档 中 的 每 个 单词 ， 判 断 该 单词 是 否 在 词汇 表 中 ， 如 果 是 ， 就 将 文档 
词 回 量 相应 位 置 的 元 素 置 为 1。 


18.4.3 分析 数据 


现在 可 以 检查 函数 的 执行 情况 ， 首 先 检查 单词 列表 ， 看 有 无 遗漏 或 重复 单词 ， 确 保 数 
据 解 析 的 正确 性 。 保 存 Nbayes.py 文件 ， 运 行 该 文件 ， 然 后 在 Python 提示 符 下 输入 : 


349 | 


| 克 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


>>> listOposts,1istClasses=loadDataset () 

>>> wordList=vocabList (1istOposts) 

>3> woOrdbist 

lI"daogq ss "stop "my has Worthliess licke mr ate ML ateoak"s 
picase SLMmvDe help prk food "quit 19 “SC DUuving' 
Jove ee "dailmation'e "take’ "him, Postindg how "stupid", not" 
工 1ea- “Problems'. garbage ss cute’s “to"l] 

经 检查 没有 遗漏 单词 ， 也 没有 重复 单词 ， 这 样 就 生成 了 共有 32 个 单词 的 词汇 表 。 
下 面 检查 setOfWordsVec() 函 数 的 执行 效果 ， 生 成 第 1 硼 文 档 的 词 回 量 : 

>>> setOfWordsVec (wordList,1istOposts[0]) 
人 
Rs IO SOC 


可 以 看 到 文档 回 量 中 索引 为 0 的 元 素 为 1， 对 应 词汇 表 中 的 dog， 可 以 查看 第 1 篇 文 
档 ['my','dog','has','flea','problems','help','please]， 发 现 单 词 dog 果然 出 现 了 。 同 理 ， 将 其 他 
元 素 值 为 1 的 都 验证 一 和 过， 完全 正确 。 

下 面 检查 单词 dog 在 第 5 篇 文档 中 是 人 否 出 现 。 

>>> setOfWordsVec (wordList,1istOposts[4]) 

Ri 

本 

可 以 看 到 文档 回 量 中 索引 为 0( 对 应 词汇 表 中 的 dog) 的 元 素 为 0, 表示 dog 没有 出 现 ， 
可 以 查看 第 $ 饥 文 档 [mr,licks',ate', my'steak,how''to'stop'him']， 单 词 dog 果然 没有 出 
现 ， 完 全 正确 。 


18.4.4 ”训练 算法 


现在 已 经 知道 了 一 个 单词 在 一 篇 文档 中 是 否 出 现 ， 也 知道 了 该 文档 所 属 的 类 别 。 接 下 
来 重 写 贝 叶 斯 公式 ， 将 之 前 的 x、y 替换 为 w， 粗 体 的 w 表示 一 个 向 量 ， 即 它 由 多 个 值 组 
成 。 在 这 个 例子 中 ， 数 值 个 数 与 词汇 表 中 的 单词 个 数 相同 。 

ee P(w |c;)P(c;) 
p(W) 

通过 前 面 的 分 析 可 以 知道 ， 需 要 计算 每 个 类 别 的 这 个 概率 值 ， 然 后 选取 概率 最 大 值 对 
应 的 类 别 作为 最 终 的 类 别 。 上 式 中 每 个 类 别 概率 的 分 母 相 等 ， 因 此 只 需要 计算 分 子 的 两 个 
概率 P(ci) 和 P(wlci)。 

首先 通过 类 别 1 (侮辱 性 留言 或 者 非 侮辱 性 留言 ， 中 的 文档 数 除 以 总 的 文档 数 来 计算 
概率 P(c)。 接 下 来 计算 P(wlc)， 这 里 假设 所 有 单词 都 互相 独立 ， 将 w 展开 为 一 个 个 独立 的 
特征 (单词 ), 那么 概率 P(wlci) 就 可 以 写 为 PCwo Wi, W2,…, Wnlci)， 可 以 使 用 P(wolci) P(wilci) 
P(wzlcD).. .PCwalci) 来 计算 上 述 概率 ， 这 样 计算 过 程 就 简便 多 了 。 

下 面 通 过 程序 来 计算 两 种 类 别 下 每 个 单词 的 概率 P(wilco)、P(wilc1) 和 每 个 类 别 的 概率 值 
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P(ci)。 因 为 该 问题 是 二 分 类 问题 ， 类 别 只 有 两 类 ， 因 此 只 要 计算 一 种 类 别 的 概率 如 P(ei)， 
男 一 种 类 别 的 概率 P(co)=1-P(ci)。 

P(c1) 表 示 和 市 有 侮辱 性 语言 的 文档 的 概率 ， 可 以 用 侮辱 性 文档 数目 除 以 文档 总 数 得 到 。 

P(wilcy) 表 示 侮 辱 性 文档 中 单词 wi 的 条 件 概 率 ， 可 以 用 侮辱 性 文档 中 单词 wi 出现 的 次 
数 除 以 所 有 侮辱 性 文档 的 单词 总 数 得 到 。 

为 了 简化 程序 的 逻辑 ， 在 计算 过 程 中 用 到 了 Numpy 中 的 一 些 函 数 ， 故 应 确保 导入 
numpy 包 ， 需 要 将 fom numpy import * 语 句 加 在 Nbayes.py 文件 的 最 前 面 。 


from numpy import * 
def trainNB (trainDocMatrix,trainCategory) : # 训 练 算法 ， 由 词 问 量 计 算 概率 
numTrainDoc=len (trainDocMatrix) # 文 档 数 
numWord=len (trainDocMatrix[0]) # 单 词 数 
# 侮 辱 性 文件 的 出 现 概率 ， 即 用 traincategory 中 所 有 的 1 的 个 数 除 以 文档 总 数 
pAbusive=sum(trainCategory) /float (numTrainDoc) 
# 构 造 单 词 出 现 的 次 数 数组 ， 初 值 为 0， 大 小 为 单词 数 
pONum=zeros (numWord) 
plNum=zeros (numWord) 
# 整 个 数据 集 单词 出 现 的 总 数 
poODenom=0.0 
plDenom=0.0 
# 对 每 个 文档 遍历 
for 1 in range (numTrainDoc): 
# 是 否 为 侮辱 性 文档 
if trainCategory[1i]==1: 
# 如 果 是 侮辱 性 文档 ， 对 侮辱 性 文档 的 癌 量 进行 求 和 
plNum+=trainDocMatrix[i] 
# 对 回 量 中 的 所 有 元 素 求 和 ， 也 就 是 计算 所 有 侮辱 性 文档 中 出 现 的 单词 总 数 
P1Denom+=Ssum (trainDocMatrix[i]) 
else: 
pONum+=trainDocMatrix[i] 
pODenom+=sum (trainDocMatrix[i]) 
# 类 别 1 下 每 个 单词 出 现 的 概率 
plVec=plNum/plDenom 
# 类 别 0 下 每 个 单词 出 现 的 概率 
pOVec=pO0Num/p0ODenom 


return pOVec,plVec,pAbusive 


tramnNB0O 函 数 有 了 两 个 参数 trainDocMatrix 和 trainCategory, 分 别 是 所 有 训练 文档 的 词 问 
量 构 成 的 矩阵 和 文档 对 应 的 类 别 标签 数组 , 输出 为 P(wlco) ( 即 p0Vec) 、P(wlci) ( 即 plVec) 
和 P(c)《〈 即 pAbusive) 。 该 函数 首先 计算 P(c1)， 即 文档 属于 侮辱 性 文档 (类 别 为 1) 的 概 
率 ， 用 侮辱 性 文档 数 除 以 文档 总 数 即 可 得 到 。 

计算 p0Vec 和 plVec( 即 P(wlco) 和 P(wlc1)) ， 需 要 计算 每 一 个 单词 在 每 个 类 别 下 的 概 
率 ， 这 里 用 了 Numpy 数组 快速 计算 ，p0Vec 和 plVec 都 是 问 量 ， 大 小 与 词汇 表 相 同 ， 回 量 
中 的 元 素 值 表示 在 相应 类 别 下 对 应 的 词汇 表 中 的 单词 出 现 的 概率 。 在 程序 中 p1Num 首先 用 
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Numpy 的 zerosO 初 始 化 为 长 度 与 词汇 表 等 长 的 全 0 数组 ; plDenom 初始 化 为 0。 在 for 循 
环 中 ,遍历 训练 集 的 所 有 文档 ， 如 果 文 档 是 侮辱 性 文档 ,就 将 该 文档 和 plNum 进行 回 量 相 
加 ， 并 且 将 该 文档 的 单词 总 数 累 加 到 plDenom; 如 果 是 正常 文档 ， 也 做 相应 的 处 理 。 这 样 ， 
循环 结束 , pl1Num 同 量 中 保存 的 是 侮辱 性 文档 中 每 个 单词 出 现 的 次 数 ; p1Denom 保存 的 是 
所 有 侮辱 性 文档 中 出 现 的 单词 总 数 ， 是 一 个 整数 ， 最 后 用 每 个 单词 出 现 的 次 数 除 以 该 类 别 
中 的 单词 忆 数 (plNum/pl1Denom)， 则 可 以 得 到 每 个 单词 在 该 类 别 下 的 概率 ， 即 P(wilci) 
COLZ nh 

现在 测试 trainNBO 函 数 的 效果 。 将 trainNBO 函 数 的 代码 加 入 Nbayes.py 文件 中 ， 运 行 
该 文件 ， 并 在 Python 提示 符 下 输入 : 

>>> listOposts,1istClasses=loadDataset () 


>>> wordList=vocabList (11stOoposts ) 
>>> wordList 


至 此 生成 一 个 包含 所 有 词 的 词汇 表 wordList， 下 面 构建 trainNBO 函 数 所 需要 的 文档 词 
回 量 矩阵。 使 用 词 癌 量 生成 函数 setOfWordsVec0O 循 环 生 成 每 篇 文档 的 词 回 量 ， 填 充 到 
trainDocMat 定 阵 中 ， 可 以 得 到 最 终 的 文档 词 回 量 和 矩阵 。 


Sy>> TranDocMat=[1 
>>7 Eo0r InDoc in 115tOposts: 

trainDocMat .append (setOfWordsVec (wordList, inDoc)) 
>>> trainDocMat 


[[1l, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 1, 1, 0, 0, 0], [1l, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, o, 
0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1], [0, 0, 1, 0, 0, 0, 0, o, 
0 0 0 P00 0 0 0 9 9 9 


[Ow ee UD 0 0 
r 0]l, [0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, o, 
r 0, 1, 0, 0, 0, 0, 0, 0, 1]l, [1, 0, 0, 0, 1, 0, 0 
r 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0 


iy 


r 


TACTICS 
0 a 和 
,| 


| 


wy 


= = 


[| 


x 了 


下 面 给 出 侮辱 性 文档 的 概率 和 两 个 类 别 的 概率 问 量 。 


>>> pOV,plV,pAb=trainNB (trainDocMat, listClasses) 


>>> pAb 

0.5 

>>> p0V 

array([0.04166667, 0.04166667, 0.125 ,0.04166667, 0. 
0.04166667, 0.04166667, 0.04166667, 0.04166667, 0.04166667, 
0.04166667, 0. ,0.04166667, 0. i 
0 ,0.04166667, 0.04166667, 0. ，0.04166667， 
0.04166667, 0. ，0.08333333，0. ，0.04166667， 
1 a ,0.04166667, 0.04166667, 0. 
0.04166667, 0.04166667]) 

>>> plV 

array([0.10526316, 0.05263158, 0. We MO T10526316. 
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Ge SMe 0 人 ne 8 
0 . ，0.05263158，0. ，0.05263158，0.05263158， 
0.05263158，0 . ，0. ，0.05263158，0 . 

站 ，0.05263158，0.05263158，0.05263158，0. 
0.15789474，0.05263158，0 . A ，0.05263158, 
0 . ，0.052631581] ) 


可 以 看 到 ,侮辱 性 文档 的 概率 pAb 为 0.5， 从 训练 数据 可 知 , 一 共有 6 篇 文档 ， 其 中 3 
篇 是 侮辱 性 文档 ， 因 此 该 值 正确 。 下 面 看 看 单词 在 给 定 类 别 下 的 概率 是 否 正确 ， 词 汇 表 的 
第 1 个 单词 是 dog， 其 在 类 别 0 中 出 现 1 次 ， 而 类 别 0 的 文档 单词 总 数 为 24 个 ， 对 应 的 条 
件 概率 为 1/24=0.04166667; 在 类 别 1 中 出 现 两 次 ， 类 别 1 的 文档 单词 总 数 为 19 个 ， 对 应 
的 条 件 概率 为 /19=0.10526316， 该 计算 是 正确 的 。 下 面 看 看 两 类 概率 中 的 最 大 值 ， 发 现 是 
plV 中 的 0.15789474， 该 概率 的 索引 为 23， 对 应 词汇 表 中 的 stupid， 意 味 着 该 单词 stupid 
是 最 能 表征 类 别 〈 侮 辱 性 文档 类 ) 的 单词 。 通 过 查看 训练 数据 ， 可 以 发 现 单词 stupid 在 3 
篇 侮辱 性 文档 中 全 部 出 现 了 。 


18.4.5 测试 算法 并 改进 


从 上 面 的 测试 结果 可 以 看 到 , 在 p0V 和 plV 中 都 存在 一 些 单词 概率 为 0 的 现象 ,那么 
计算 P(wolci)P(wilc)P(wz|ci)…P(wnlci) 的 值 肯定 为 0, 这 将 导致 用 朴素 贝 叶 斯 分 类 右 对 文档 分 
类 时 下 面 式 子 中 的 分 子 为 0， 无 法 比较 概率 大 小 ， 最 终 无 法 分 类 。 

pl |w) = PISOP(e) 
p(W) 

为 了 避免 这 种 现象 ， 可 以 将 所 有 单词 的 出 现 次 数 由 初始 化 为 0 改 为 1， 并 将 plVec= 
plNum/plDenom 和 p0Vec ==p0Num/p0Denom 中 的 分 母 初始 化 为 2.0, 确保 分 母 不 为 0。 注 
意 , 这 里 初始 化 为 1 或 2 的 目的 主要 是 为 了 保证 分 子 和 分 母 不 为 0, 大 家 可 以 根据 业务 需 
求 进 行 更 改 。 

将 traimnNBO 函 数 中 初始 化 的 这 几 条 语句 : 

pONum=zZeros (numWord) 

plNum=zZeros (numWord) 


pODenom=0.0 
plDenom=0.0 


修改 为 : 


pONum=ones (numWord) 
plNum=ones (numWord) 
poODenom=2.0 
plDenom=2.0 


另 一 个 需要 注意 的 问题 是 下 溢出 ， 这 是 由 于 很 多 很 小 的 数 相 乘 造 成 的 。 当 计算 乘积 
P(wolci)P(wilci)P(wz|ci)…P(walci) 时 ， 由 于 大 部 分 因子 都 非常 小 ， 乘积 将 会 变 得 更 小 ， 所 以 可 
能 会 产生 下 溢出 或 者 得 到 不 正确 的 答案 。 一 种 有 效 的 解决 办 法 是 对 乘积 取 自然 对 数 。 因 为 


353 | 


| 证 一 项 目 案 例 开 发 
从 人 入门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


ln(ab)=ln(a)+ln(b), 于 是 通过 求 对 数 可 以 避免 下 溢出 或 者 浮 点 数 合 入 导致 的 错误 .在 数学 上 ， 
f(x) 与 In(f(x)) 的 取 值 结果 虽然 不 同 ， 但 在 相同 区 域内 变化 的 趋势 一 致 ， 并 且 在 相同 值 上 取 
到 极 值 。 因 此 ， 采 用 自然 对 数 进行 处 理 不 会 影响 最 终结 果 ， 所 以 将 tainNBO 函 数 中 return 
前 的 两 行 代 码 修改 为 : 


plVec=log (plNum/plDenom) 
pOVec=1l0og (pONum/pODenom) 


到 现在 为 止 ， 分 类 器 已 经 修改 好 了 ， 下 面 开 始 检 验 分 类 效果 。 
18.4.6 ”使 用 算法 进行 文本 分 类 


依据 村 素 内 叶 斯 公式 Pe. |w) = 一 全 及 前 面 的 分 析 ， 内 要 计算 公式 中 的 分 子 妈 


可 ,重点 是 比较 分 子 的 大 小 ， 分 子 大 的 对 应 的 类 别 就 是 文档 的 类 别 。 将 traImNBO 函 数 求 得 
的 3 个 概率 p0Vec、plVec、pAbusive 及 需要 分 类 文档 的 词 回 量 代入 公式 ， 分 别 比较 两 种 类 
别 下 的 概率 大 小 ， 即 可 确认 文档 的 类 别 。classifyNBO 函 数 实现 了 上 述 过 程 。 


def classifyNB (textVec,pOVec,plVec,pClassl1): 


分 类 函数 
:param textVec: 要 分 类 的 文档 问 量 
:param p0Vec: 正常 文档 类 (类别 0) 下 的 单词 概率 列表 
:param plVec: 侮辱 性 文档 类 (类 别 1) 下 的 单词 概率 列表 
:param pClassl: 侮辱 性 文档 (类别 1) 概率 
:return: 类 别 1 或 0 
pl=sum (textVec*plVec)+log (pClass]1) 
pO0=sum (textVec*pO0Vec)+log (1 .0~-pClass]1) 
peimnE( pI "pl) 
print {pO=" -pO) 
人 RDU: 

return 1 
else: 


return 0 


为 了 测试 更 加 方便 ， 将 前 面 在 Python 提示 符 下 的 所 有 操作 进行 封 交 ， 构 造 测试 函数 
testNB() 。 


def testNB () : # 朴 素 贝 叶 斯 算法 测试 
# (1) 加 载 数据 集 
listOposts,1istClasses=loadDataset () 
# (2) 创建 词汇 表 


wordList=vocabList (1istOposts) 
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# (3) 构造 训练 数据 的 文档 词 回 量 和 矩阵 

EranDocMat=11 

for inDoc an 11i3tOposts: 
trainDocMat .append (setOfWordsVec (wordList, inDoc)) 

# (4) 训练 数据 

pOV, plV,pAb=trainNB (array (trainDocMat),array (listClasses)) 

# (5) 测试 数据 

testText=[ ove ，myY ，ate j 

thisDoc=array (setOofWordsVec (wordList,testText)) 

print (testText, 'classified as:"',classifyNB (thisDoc, pOV,pilV,pADb)) 

testText=["'stupid','dog'] 

thisDoc=array (setOfWordsVec (wordList,testText)) 

print (testText, 'classified as:"',classifyNB (thisDoc,pOV,Ppl1V,pADb)) 


将 所 有 函数 保存 到 Nbayes.py 文件 中 ， 运 行 该 文件 ， 并 在 Python 提示 符 下 输入 : 
>>> testNB () 
可 以 看 到 运行 结果 如 下 : 


Dl=—9.820 114493/130215 
pO0O=-7.694848072384611 

['love', ‘my', ‘ate'] classified as: 0 
pl=—4.291285406219871915 
p0=-6.53161930716042964 

['stupid', "'dog'] classified as: 1 


18.5 ”使 用 朴素 贝 叶 斯 分 类 算法 过 滤 
垃圾 邮件 


18.4 节 运 用 朴素 贝 叶 斯 算法 完整 实现 了 社区 留言 板 言论 的 分 类 ， 下 面 将 朴素 贝 叶 斯 算 
法 应 用 于 垃圾 邮件 过 滤 ， 同 样 用 朴素 贝 叶 斯 算法 分 类 的 通用 框架 来 解决 该 问题 。 使 用 朴素 
贝 叶 斯 算法 对 电子 邮件 进行 分 类 的 实现 流程 如 下 。 

(1) 收集 训练 数据 : 提供 已 知 的 文本 文件 。 

(2) 准备 数据 : 将 文本 文件 解析 为 词 癌 量 。 

(3) 分 析 数 据 : 检查 词 条 确保 解析 的 正确 性 。 

(4) 训练 算法 : 从 词 回 量 计 算 概率 ， 使 用 前 面 建立 的 trainNBO 函 数 。 

(5) 测试 算法 : 使 用 朴素 贝 叶 斯 算法 进行 交叉 验证 。 

(6) 使 用 算法 : 构建 完整 的 程序 对 一 组 邮件 进行 分 类 ， 将 错 分 的 邮件 输出 到 屏幕 上 。 


18.5.1 ”收集 训练 数据 


假设 训练 数据 已 知 ， 这 里 用 50 封 邮件 作为 训练 数据 ， 其 中 垃圾 邮件 和 非 垃 圾 邮件 各 
25 封 。 
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18.5.2 ”将 文本 文件 解析 为 词 回 量 


在 18.4 节 中 ,为 了 痢 重 理解 朴素 贝 叶 斯 算法 分 类 的 核心 过 程 ， 文 本 的 词 回 量 是 预先 给 
定 的 ， 下 面 介 绍 如 何 从 文本 构建 自己 的 词 问 量 。 

对 于 一 个 碳 文 文本 字符 串 ， 可 以 使 用 He 的 string.splitO 方 法 切 分 。 下 面 看 一 下 实 
际 的 运行 效果 。 在 Python 提示 符 下 输入 


>>> text='"'In fact, persistence hunting remained in use until 2014, such 
as with the San People of the Kalahari Desert.'" 

> text SplLitl) 

[nFacte" persiotence "hunting remmined ne Use an 
2 
'Kalahari', 'Desert.'] 


可 以 看 到 在 默认 情况 下 splitO 按 照 单词 之 间 的 空格 进行 切 分 ,整体 切 分 效 朱 不错, 但 美 
中 不 足 的 是 ， 标 点 符号 也 被 当 作 单词 的 一 部 分 进行 了 切 分 。 可 以 使 用 正则 表达 式 来 切 分 文 
本 ， 其 中 分 隔 符 是 除 单词 、 数 字 以 外 的 任意 字符 串 。 


>>> import re 

>>> regEx=re.compile ("'\W*") 

>>> wordList=regEx.split (text) 

>>> wordList 

[ “In "fact", "persistence, hunting’s, remained’,. "in', se Until 
2014" "such "qs "with the A oa Deople oF the Kalahary 
"BeserE a "| 


可 以 看 到 标点 符号 没有 了 ， 但 是 多 了 空 字 符 串 ， 可 以 计算 字符 串 的 长 度 ， 只 返回 长 度 
大 于 0 的 字符 串 ， 去 掉 空 字符 串 。 这 里 用 列表 推导 式 实 现 : 


> [Tword for word 1n wordbList i1f lentword}>0] 

I Tn tact > “persistence hanting Temed noe ntlL" 
A i De 2 RE 
" Desert '" ] 


可 以 看 到 空 字符 串 去 反 了 ,但 是 喘 文 句子 的 第 1 个 单词 和 专用 名 词 的 站 字母 是 大 写 的 ， 
为 了 使 所 有 单词 的 形式 统一 ， 将 其 全 部 转换 成 小 写 ， 用 lower0 函 数 即 可 实现 。 


5» 5 Word Lower(tl for word in Wordist 1f Jentwordl>0l 

Pramn fact Jpersistence "honting ye remained Vin "Use until. 
Ola nen An WIth En gam eo eole Ene kalghari 
'desert'] 


妨 外 ， 在 实际 处 理 中 通常 也 要 过 小 挥 长 上 度 小 于 3 的 字符 串 ， 使 得 词汇 表 尽 量 小 一 些 。 
将 上 面 的 文本 处 理 过 程 整理 为 一 个 独立 的 文本 解析 函数 。 


import re 
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def textParse (text): 
regEx=re.compile ("'\W*") 
wordList=re.split (regEx, text) 


PEDTn [Inord iouerIl EoOr word nn oordList 1f Tenfword] >> 


当然 ， 在 实际 应 用 中 文本 解析 是 一 个 相当 复杂 的 过 程 ， 这 里 是 一 种 简单 的 处 理 。 尤 其 
是 中 文 文本 的 解析 ， 由 于 不 像 英 文句 子 中 有 空格 分 隔 ， 要 识别 出 中 文 文本 中 的 词汇 ， 即 中 
文 分 词 本 映 就 是 一 个 值得 研究 的 应 用 领域 .但 好 在 现在 有 一 些 成 熟 的 支持 Python 的 专门 的 
分 词 模块 ， 这 里 推荐 使 用 jieba 分 词 ， 它 专门 使 用 Python 的 分 词 系统 ， 占 用 的 资源 少 ， 常 
识 类 文档 的 分 词 精 度 较 高 ， 对 于 非 专 业 文 档 绰 绰 有 余 ， 如 果 需 要 可 以 直接 下 载 使 用 。 

现在 将 电子 邮件 文本 传 入 textParse0 函 数 ， 就 可 以 得 到 该 电子 邮件 的 单词 列表 。 

调用 18.4 节 实 现 的 vocabList0 函 数 可 以 生成 所有 训练 数据 的 词汇 表 。 构建 文档 的 词 同 
量 可 以 用 18.4 节 实 现 的 setOfWordsVec0 函 数 。 训 练 算法 则 直接 调用 tramNB0O 函 数 ， 这 里 
不 再 重复 扳 述 。 直 接 用 分 类 算法 进行 邮件 分 类 测试 。 


18.5.3 ”使 用 朴素 贝 叶 斯 算法 进行 邮件 分 类 


这 里 使 用 朴 系 贝 叶 斯 算法 对 邮件 进行 分 类 ， 并 进行 交叉 验证 。 交 叉 验 证 也 称 为 循环 佑 
计 ， 是 一 种 统计 学 上 将 数据 样本 切割 成 较 小 子 集 的 实用 方法 。 在 给 定 的 建 模样 本 中 ， 拿 出 
大 部 分 样本 进行 建 模 ， 留 小 部 分 样本 用 刚 建立 的 模型 进行 预报 ， 并 求 这 小 部 分 样本 的 预报 
误差 。 

本 例 中 的 样本 数据 共有 50 封 邮件 ， 随 机 选择 10 封 邮件 作为 测试 集 ， 剩 下 的 40 封 邮 
件 作为 训练 集 。 


def SpamIest () : 
对 贝 叶 斯 垃圾 邮件 分 类 器 进行 目 动 化 处 理 
return: 对 测试 集中 的 每 封 邮件 进行 分 类 ， 知 邮件 分 类 错误 ， 则 错误 数 加 1， 最 后 返回 错 分 率 
emailWordList=[] # 邮 件 的 词 同 量 列 表 ， 大 小 与 邮件 数 相同 
classList=[] # 邮 件 的 类 别 标签 列表 
# 这 里 提供 的 训练 邮件 共 50 封 ， 垃 圾 邮件 和 正常 邮件 分 别 25 封 
for 1 in range(1,26) : 
# 切 分 ， 解 析 数 据 ， 并 归 类 为 1 类 别 
wordList=textParse (open ('email/spam/®%d.txt' $ 1 ,encoding="utf-8") 
.read()) 
emailWordList.append (wordList) 
classList.append (1) 
# 切 分 ， 解 析 数 据 ， 并 归 类 为 0 类 别 
wordList=textParse (open('email/noSpam/%d.txt" $ 1 ,encoding="utf-8") 
.read()) 
emailWordList.append (wordList) 
classList.append (0) 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 有 息 虫 、 游 戏 和 机 器 学 习 


# 创 建 词汇 表 


wordTable=vocabList (emailWordL1ist) 


trainingSet=1list (range (50)) 
# 构 造 测试 集 
testSet=[] 
# 随 机 选择 10 封 邮 件 用 来 测试 
for 1 in range(10): 
randIindex=int (random.uniform(0,1en(trainingset))) 
testSet .append (trainingSsSet [randIindex]) 
del (trainingSset [randIndex]) 
# 构 造 训 练 集 文 档 词 回 量 矩 阵 和 对 应 的 类 别 回 量 
EFazdnmnDocNMa 三 门 
EFFECT SS 国 
for docIindex in trainingset: 
trainDocMat .append (setOfWordsVec (wordTable., 
emalilWordList[docIindex])) 
trainDocClass.append (classList[docIndex]) 
# 用 训练 集 的 邮件 进行 训练 
pOV,plV,pSpam=trainNB (array (trainDocMat) ,array (trainDocClass)) 
errorCount=0 # 记 录 错 误 邮 件 的 数目 
# 用 测试 集中 的 邮件 进行 分 类 测试 
for docIindex in testSet : 
# 对 每 一 封 邮 件 生成 词 回 量 
wordVector=setOfWordsVec (wordTable,emailWordList[docIndex]) 
# 测 试 的 分 类 类 别 与 原 标注 类 别 比 较 ， 寿 不 相等 ， 说 明 分 类 错误 
if classifyNB (array (wordVector),pOV,plV,pSsSpam) != 
laselistidocinderl: 
print ("classification error:",docIindex) 
errorCount+=1 
errRate=float (errorCount/len (testset}) # 错 分 率 
print ('the error rate is :', errRate) 


spamTest() 函 数 对 朴素 贝 叶 斯 垃圾 邮件 分 类 器 进行 自动 化 处 理 。 首 先导 入 已 经 整理 好 的 
垃圾 邮件 和 正常 邮件 的 文本 文件 , 分 别 在 文件 夹 spam 与 noSpam 下 ， 并 分 别 对 它们 进行 解 
析 处 理 ， 生 成 邮件 的 词 向 量 列表 emailWordList 和 类 别 列表 classList。 调 用 18.4 节 案 例 的 
vocabListO 方 法 ， 可 以 得 到 没有 重复 单词 的 词汇 表 wordTable。 

接 下 来 进行 交叉 验证 ， 需 要 分 别 构建 训练 集 和 测试 集 ， 本 例 中 共有 50 封 邮件 ， 随 机 
选择 10 封 作 为 测试 集 ， 剩 下 的 40 封 邮 件 作 为 训练 集 。 那 么 如 何 选择 呢 ? 初始 化 时 
trainingSet list(range(50))、testSet=[], 可 以 知道 trainingSet 是 一 个 0 一 49 的 整数 列表 ,testSet 
是 一 个 空 列表 。 随 机 函数 random.uniform() 可 以 生成 一 个 指定 范围 内 的 随机 浮 点 数 ， 
int(random.uniform(0,len(trainingSet))) 将 产生 一 个 0 一 49 的 整数 ， 产 生 的 数字 加 入 测试 集 列 
表 testSet 中 ， 同 时 将 该 数字 从 训练 集 trainingSet 中 删除 ， 循 环 10 次 ， 就 随机 产生 了 10 个 
0 一 49 的 整数 ， 整 数 索引 对 应 的 邮件 作为 测试 集 ， 剩 下 的 40 封 邮件 作为 训练 集 。 

接着 遍历 训练 集中 的 所 有 文档 ， 对 每 封 邮件 基于 词汇 表 并 使 用 setOfWordsVec() 函 数 构 
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造 训练 集 的 词 回 量 和 矩阵 tramDocMat， 同 时 生成 类 别 同 量 tramDocClass， 并 通过 训练 函数 
trainNBO 计 算出 分 类 所 需要 的 3 个 概率 。 

最 后 遍历 测试 集 ， 对 每 封 邮 件 用 classifyNBO 进 行 分 类 ， 与 已 知 的 邮件 类 别 进行 对 比 ， 
如 果 分 类 错误 则 错误 数 加 1， 并 输出 错 分 的 邮件 索引 ， 以 便于 进一步 查验 ， 最 后 给 出 总 的 
错 分 率 。 

下 和 面 对 上 述 过 程 进行 测试 ， 将 上 述 所 有 程序 代码 保存 全 Nbayes.py 文件 中 并 运行 ， 在 
Python 提示 符 下 输入 : 


>>> spamTest () 

the error rate is : 0.0 
>>> spamTest () 
classification error: 32 


oh | = eal 


spamTest() 函 数 会 输出 10 封 随机 选择 的 邮件 的 分 类 错误 率 ， 上 面 的 测试 是 运行 两 次 的 
结束， 因为 测试 集 的 10 封 邮件 是 随机 选择 的 , 每 次 选择 的 测试 集 不 一 定 相 同 ， 所 以 每 次 的 
运行 结果 可 能 会 有 些 差 别 。 如 果 有 分 类 错误 ,会 输出 文档 索引 ， 以 便于 进一步 分 析 错 分 的 
邮件 。 为 了 更 精确 地 估计 错 分 率 ， 需 要 重复 运行 多 次 ， 然 后 求 平 均值 ， 运 行 100 次 ， 获 得 
的 平均 错 分 率 为 3.5%。 


18.5.4 改进 算法 


在 前 面 的 算法 中 ， 把 邮件 文本 用 词 集 模 型 表示 ， 将 文本 的 每 个 词 作 为 一 个 特征 ， 将 词 
是 否 出 现 作 为 特征 的 值 。 实 际 上 ， 大 家 经 常见 到 一 个 词 在 一 个 文本 中 多 次 出 现 的 情况 ， 一 
个 词 多 次 出 现 是 否 可 以 比 是 否 出 现 更 加 能 够 表达 茶 种 意义 ? 这 种 方法 被 称 为 词 袋 (Bag of 
Words) 模型 。 下 面 来 试 一 试 。 

只 要 将 词 集 模型 中 的 单词 是 否 出 现 修改 为 出 现 次 数 就 可 以 了 ， 这 样 只 需要 对 
setOfWordsVec() 函 数 做 简单 修改 ， 当 扫 摘 到 一 个 单词 时 就 将 词 回 量 中 该 单词 的 对 应 值 加 1。 


def bagOfWordsVec (vocabList,inputText): 
textVec=[0]*len (vocabList) # 创 建 一 个 所 包含 元 素 都 为 0 的 回 量 
# 遍 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 将 文档 向 量 中 的 对 应 值 加 1 
for word in inputText: 
if word in vocabList: 
textVeclvocabbist TIndexiword) 1T=1 


return textVec 


修改 spamTest0 函 数 ， 将 两 处 生成 词 同 量 的 语句 改 为 调用 上 面 的 词 袋 模型 函数 
bagOfWordsVec()， 重 新 执行 spamTestO 函 数 100 次 ， 得 到 的 错 分 率 为 0， 看 来 这 样 修改 后 
确实 可 以 提 融 分 类 的 准确 度 。 当 然 ， 在 实际 分 类 中 是 做 不 到 百分之百 正确 的 ， 这 可 能 和 用 
户 选用 的 数据 集 有 关 。 
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18.6 ”使 用 Scikit-Learn 库 进行 文本 分 类 


Scikit-Learn 是 一 个 用 于 机 器 学 习 的 Python 库 ， 建 立 在 Numpy、Scipy 和 Matplotlib 基 
出 之 上 。 它 提供 了 机 器 学 习 利用 的 算法 模块 ， 例 如 监督 学 习 、 无 监督 学 习 、 模 型 选择 和 评 
佑 、 数 据 集 转 换 等 ， 在 监督 学 习 模块 中 包含 机 器 学 习 浊 用 的 分 类 算法 ， 例 如 村 每 贝 叶 斯 、 
KNN、 决 策 树 、 文 持 向 量 机 等 。 

Scikit-Learm 的 官方 网 站 “http://scikit-learn.org ”是 学 习 和 应 用 机 器 学 习 算 法 的 最 重要 
的 工具 之 一 ， 以 朴素 贝 叶 斯 算法 为 例 ， 网 站 提供 了 一 整套 算法 学 习 的 教程 和 资源 ， 网 址 为 
“http://scikit-learn.org/stable/modules/naive bayes.html 。 

如 果 要 安装 Scikit-Learn， 需 要 先 安装 Numpy、Scipy 和 Matplotlib， 直 接 用 pip install 
命令 安 疙 : 

pip install numpy 

pip install scipy 

pip install matplotlib 


pip install scikit-learn 


本 节选 择 Scikit-Learn 的 朴素 贝 叶 斯 算法 进行 文本 分 类 ， 对 18.4 节 和 18.5 节 的 例子 重 
新 进行 实现 。 

用 Scikit-Learn 的 朴素 贝 叶 斯 算法 进行 文本 分 类 包含 以 下 几 个 步骤 : 

(1) 收集 样本 数据 。 

(2) 提取 文本 特征 ， 生成 文本 的 向 量 空间 模型 。 

(3) 训练 分 类 器 。 

(4) 在 测试 集 上 进行 测试 。 

(5) 分 类 结果 评估 。 


18.6.1 文本 分 类 尝 用 的 类 和 水 数 


@@ lo0ad_files0 罗 数 

该 函数 位 于 sklearn.datasets 模块 下 ， 功 能 是 加 载 文本 文件 ， 将 二 层 文件 夹 名 字 作 为 分 
类 类 别 。Scikit-Leam 本 喘 也 目 市 了 一 些 数据 集 ， 可 以 供用 户 学 习 测试 使 用 ， 一 般 通 过 
sklearn.datasets 模块 下 的 其 他 函数 加 载 使 用 。 


SKklearn.dqatasets.load files(container path, description=None, 


categories=None, load content=True, shuffle=True, encoding=None, 


decode error="'strict', random state=0) 

主要 参数 如 下 。 

e container path: 文件 夹 的 路 径 。 

。 load _ content: 是 否 把 文件 中 的 内 容 加 载 到 内 存 ， 该 项 为 可 选项 ， 默 认 值 为 True。 
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e encoding: 编码 方式 。 当 前 文本 文件 的 编码 方式 一 般 为 “utf-8”"， 如 果 不 指 明 编 码 方 
式 (encoding=None), 那么 文件 内 容 将 会 按照 bytes 处 理 , 而 不 是 按照 unicode 处 理 ， 
其 默认 值 为 None。 

该 函数 的 返回 值 为 Bunch 对 象 ， 主 要 属性 如 下 。 

。 data: 原始 数据 。 

e filenames: 每 个 文件 的 名 字 。 

。 target: 类 别 标签 (从 0 开始 的 整数 索引 )。 

。 target names: 类 别 标签 的 具体 含义 (由 子 文件 夹 的 名 字 决 定 )。 

注意 : 需要 将 数据 组 织 成 如 下 文件 结构 ， 有 几 种 类 别 就 有 几 个 子 文件 来， 当然 文件 夹 

及 文件 的 名 字 可 以 自 定 义 。 
container folder/ 
category 1 folder/ 
1 ,a 


category 2 folder/ 
File A txt Tlie Ld 


例如 在 垃圾 邮件 过 滤 例 子 中 ，email 文件 夹 下 的 二 级 文件 夹 spam 和 noSpam 将 作为 类 
别 标签 。 

@ train_test_split0 软 数 

该 图 数位 于 sklearn.model] selection 模块 下 , 能 够 从 样本 数据 随机 按 比 例 选 取 训 练 子 集 
和 测试 子 集 ， 并 返回 划分 好 的 训练 集 测试 集 样本 和 训练 集 测 试 集 标签 。 

sklearn.model selection.train test split(train data,train target, 


test size, random state) 


参数 如 下 。 
。 train data: 被 划分 的 样本 特征 集 。 
。 train target: 被 划分 的 样本 标签 。 
e test_size: 如 果 是 0 一 1 的 浮 点 数 ， 表 示 样 本 占 比 ; 如果 是 整数 ， 则 是 样本 的 数量 ， 
该 项 为 可 选项 ， 默 认 值 为 None。 
。 random state: 随机 数 的 种 子 , 不 同 的 种 子 会 造成 不 同 的 随机 采样 结果 ， 相 同 的 种 子 
采样 结果 相同 ， 该 项 为 可 选项 ， 默 认 值 为 None。 
各 CountVectorizer 类 
该 类 是 文本 特征 提取 模块 sklearm.feature_extraction text 下 的 一 个 常用 的 类 ， 能 够 将 文 
档 词 块 化 ， 并 进行 数据 预 处 理 ， 例 如 去 首 调 、 转 小 写 、 去 停 用 词 ， 最 后 生成 文档 的 词 频 算 
阵 ， 即 前 面 所 说 的 词 袋 模型 。 


class sklearn.feature extraction.text.CountVectorizer (Input=u'rcontent ' ， 


和 


encoding=u'utf-8', decode error=u'strict',strip accents=None, lowercase 
=True, preprocessor=None, tokenizer=None, stop words=None,token pattern 
-0 (ND ngram range tl Ls ananlyzer nm word max df=1.0,min 
df=1,max features=None, vocabulary=None, binary=False, dtype=<type 'numpy. 
1nt64">) 
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其 参数 很 多 ， 这 里 介绍 最 常用 的 几 个 ， 其 他 用 默认 值 即 可 。 

e stop words: 设置 停 用 词 ， 可 以 为 english、list 或 None (默认 值 )， 设 为 english 将 
使 用 内 置 的 英语 俘 用 词 , 设 为 一 个 list 可 目 定 义 停 用 词 , 设 为 None 则 不 使 用 停 用 词 ， 
设 为 None 有 日 max dfe[0.7, 1.0) 将 目 动 根据 当前 的 语料库 建立 俘 用 词 表 。 

。 lowercase: 是 侣 将 所 有 字符 转变 成 小 写 ， 默 认 值 为 True。 

。 token _ pattern: 表示 token 的 正则 表达 式 ， 只 有 当 analyzer 一 'word' 时 才 使 用 ， 默 认 
的 正则 表达 式 选择 两 个 及 以 上 的 字母 或 数字 作为 token, 标点 符号 默认 当 作 token 分 
隔 人 符 ， 而 不 会 被 当 作 token。 

e analyzer: 一 般 使 用 默认 值 , 可 设置 为 string 类 型 {'word', 'char', 'char wb 或 callable， 
特征 基于 wordn-grams 或 character n-grams。 

e decode error: 默认 为 strict， 硅 过 到 不 能 解码 的 字符 将 报 UnicodeDecodeError 错误 ， 
设 为 jgnore 将 会 忽略 解码 错误 。 

CountVectorizer 类 的 核心 函数 是 fit transform0， 通 过 该 函数 能 够 学 习 词汇 表 ， 返 回 文 

档 的 词 频 矩阵 。 


fit transform(raw documents, y=None) 


其 参数 raw_documents 为 友 代 器 ， 可 以 是 str、unicode 或 文件 对 象 。 

其 返回 值 是 文档 的 词 频 和 矩阵 ， 和 矩阵 大 小 为 文档 数 x 特征 数 。 

@ MultinomialNB 类 

在 Scikit-Leam 中 共有 3 个 朴素 贝 叶 斯 的 分 类 算法 类 ， 分别 是 GaussianNB 、 
MultinomialNB 和 BermoulliNB。 其 中 ，GaussianNB 是 先 验 概率 为 高 斯 分 布 的 朴素 贝 叶 斯 ， 
MultinomialNB 是 先 验 概率 为 多 项 式 分 布 的 朴素 贝 叶 斯 ， BernoulliNB 是 先 验 概率 为 伯 努 
利 分 布 的 朴素 贝 叶 斯 。 

这 3 个 类 适用 的 分 类 场景 不 同 ， 一 般 来 说 ， 如 果 样 本 特征 的 分 布 大 部 分 是 连续 值 ， 使 
用 GaussianNB 会 比较 好 ; 如 果 样 本 特征 的 分 布 大 部 分 是 多 元 离散 值 ， 使 用 MultinomialNB 
比较 合适 如果 样 本 特征 是 二 元 离散 值 或 者 很 稀 朴 的 多 元 离散 值 ， 应 该 使 用 BernoulliNB。 
因为 考虑 文本 分 类 中 的 特征 是 离散 的 单词 ， 所 以 用 MultinomialNB。 


class sklearn.naive bayes.MultinomialNB (alpha=1.0,fit prior=True,class 


prior=None) 

参数 如 下 。 

。 alpha: 拉 普 拉 斯 平滑 参数 ， 是 一 个 大 于 0 的 常数 ， 该 项 为 可 选项 ， 默 认 值 为 1。 

e fit prior: 是 否 要 考虑 先 验 概率 ， 如 果 是 False， 则 所 有 的 样本 类 别 输出 都 有 相同 的 
类 别 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 True。 

。 class_prior: 类 别 的 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 None。 

MultinomialNB 类 下 有 两 个 核心 函数 。 

(1) fit0 函 数 : 拟 合 朴 素 贝 叶 斯 分 类 器 。 


fit(X，Y，Sample weight=None) 
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参数 如 下 。 

e。X: 训练 数据 的 词 频 定 阵 。 

。y: 训练 数据 的 类 别 标签 回 量 。 

其 返回 值 为 MultinomialNB 对 象 。 

(2) predictO 函 数 : 对 测试 集 进行 分 类 。 


predict (x) 


参数 X 为 要 分 类 的 文档 的 词 频 窍 阵 ， 和 矩阵 大 小 为 测试 集中 的 文档 数 x 特征 数 。 

其 返回 值 为 X 的 预测 目标 值 品 量 ， 疝 量 大 小 与 测试 集中 的 文档 数 一 致 。 

@@ classification_report0 困 数 

该 函数 位 于 sklearn.metrics 模块 下 ， 用 于 显示 主要 分 类 指标 的 文本 报告 ， 在 报告 中 显 
示 每 个 类 的 准确 率 、 召 回 率 、F1 值 等 信息 。 

sklearn.metrics.classification reportl(y true, y pred, labels=None, 


target names=None, sample weight=None, digits=2) 


主要 参数 如 下 。 
。y_true: 一 维 数组 ， 或 标签 指示 器 数组 / 稀 跑 和 矩阵， 目标 值 。 
。y_pred: 一 维 数组 ， 或 标 俭 指示 器 数组 / 黎 下 和 矩阵 ， 分 类 器 返回 的 估计 值 。 
。 labels: 一 维 数组 ， 报 表 中 包含 的 标 位 索引 列表 ， 可 选 。 
target_ names: 字符 串 列 表 ， 与 标签 匹配 的 显示 名 称 ， 可 选 。 
。 sample _ weight: 一 维 数组 ， 样 本 权重 ， 可 选 。 
digits: int 型 ， 输 出 浮 点 值 的 位 数 ， 可 选 。 
其 返回 值 为 每 类 文本 的 准确 率 、 召 回 率 、F1-score 等 信息 ，string 类 型 。 
对 于 数据 测试 结果 有 下 面 4 种 情况 。 
TP: 预测 为 正 ， 实 际 为 正 ，FP: 预测 为 正 ， 实 际 为 负 ; FN: 预测 为 负 ， 实 际 为 正 ; 
TN: 预测 为 负 ， 实 际 为 负 。 
关于 准确 率 、 召 回 率 、F1-score， 详 细 定 义 如 下 : 
准确 率 =TP/ (TP+FP) 
召回 率 =TP/ (TP + FN) 
Fl—score= 2xTP/(2xTP + FP + FN) 
熟悉 了 这 些 类 和 函数 的 使 用 ， 就 可 以 实现 具体 的 案例 了 。 


18.6.2 条例 实现 


创建 一 个 名 为 sklearn NB.py 的 新 文件 , 用 Scikit-Learn 库 的 朴素 贝 叶 斯 算法 将 18.4 节 
和 18.5 节 的 例子 重新 进行 实现 。 


from sklearn import datasets 


from sklearn.feature extraction.text import CountVectorizer 
from sklearn.naive bayes import MultinomialNB # 导 入 多 项 式 贝 叶 斯 算法 包 
from sklearn.cross validation import train test split 
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from sklearn.metrics import classification report 
# 留 言 板 案例 的 Scikit-Learn 实现 
def testNB skl1(): 
posting=['my dog has flea problems help please', 'maybe not take him to 
dog park stupid’., 
'my dalmation is so cute I love him','stop posting stupid 
worthless garbage', 
'mr licks ate my steak how to stop him', 'quit buying worthless 
dog food stupid'] 
classVec=[0,1,0,1,0,1] 
# 交 叉 验 证 选择 训练 集 和 测试 集 
train data,test data,train y,test y=train test split (posting, 
classVec,test size=0.2,train size=0.8) 
# 生 成 文本 的 词 频 矩阵 
vectorizer=CountVectorizer () #CountVectorizer 用 于 词 袋 模型 统计 词 频 
wordX=vectorizer.fit transform (traln data) 


# 训 | 练 分 类 器 

clf=MultinomialNB() .fit (wordx,train y) 

# 预 测 测试 集 的 分 类 结果 

test wordX=Vvectorlzer .transform(test data) .toarray() 
predicted elt eoliecEtEest word 预测 


for doc,category in zlp(test data,predicted): 
print (doc. ">" Categqory) 
# 在 测试 集 上 的 性 能 评估 
classTarget names=[' 正 常言 论 ',' 侮 辱 性 言论 '] 
print (classification report (test y,predicted,target names= 
classTarget names)) 
# 垃 圾 邮件 过 滤 的 Scikit-Learn 实现 
def spamTest sk]l (): 
# 加 载 email 文件 夹 下 的 数据 
Biase data datasetaseload Erles("emarit™) 
# 交 又 验 证 选择 训练 集 和 测试 集 
train data,test data,train y,test y= 
train test split (base data.data,base data.target, test size= 
0.2,train size=0.8) 
# 生 成 文本 的 词 频 矩 阵 
vectorizer=CountVectorizer(stop words="english", 
decode error='ignore') 
WOPOZ VectorizZer FI Eranstorm(traimn datal 
# 训 | 练 分 类 器 
clf=MultinomialNB() .fit (wordx,train y) 
# 预 测 测试 集 的 分 类 结果 
test wordX=vectorizer.transform(test data) .toarray () 
#newDoc tfidf=transformer.transform(newDoc wordx) 
# 得 到 新 文档 每 个 词 的 TF-IDF 值 
predicted=clf.predict (test wordx) # 预 测 
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print (predicted) 
# 在 测试 集 上 的 性 能 评估 


print (classification report (test y,predicted,target names= 


base data.target names)) 
运行 skleam NB.py， 在 Python 提示 符 下 输入 testNB_skl()， 可 以 得 到 留言 是 否 为 侮辱 
性 言论 的 预测 分 类 结果 及 预测 评估 报告 : 


maybe not take him to dog park stupid : 0 
quit buying worthless dog food stupid : 1 


precision recall fl-score support 
正常 言 i 0.00 0.00 0.00 0 
侮辱 性 言论 1.00 0.50 0.67 2 
avg/total 有 ss hk 7 这 


在 Python 提示 符 下 输入 spamTest skl0， 可 以 得 到 垃圾 邮件 过 滤 的 预测 分 类 结果 及 预 
测评 估 报 告 : 


LDO 


precision recall fl-score support 
noSpam T1500 > 村 时 二 和 各 6 
spam T= 1.00 ud 图 
avg/total 1 i.00 1=00 10 


注意 : 因为 训练 集 和 测试 集 是 随机 划分 的 ， 所 以 每 次 的 运行 结果 不 一 定 相 同 。 
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19.1 手 与 体 识 别 秦 例 需 : 


人 类 对 图 19-1 所 示 的 一 串 手 写 图 像 可 以 宫 不 费力 地 认 出 是 504192, 这 
是 因为 人 体 的 视觉 系统 相当 神奇 ， 但 是 让 计算 机 进行 识别 就 比较 复杂 了 。 
假如 给 定 一 个 数字 5 的 图 像 ， 计 算 机 如 何 描述 出 这 是 一 个 数字 5 呢 ? 我 们 
可 以 把 计算 机 当 作 一 个 小 孩子 ， 让 它 见 很 多 的 5 的 图 片 ， 慢 慢 就 形成 
了 自己 的 判断 标准 ， 而 这 种 让 计算 机 学 习 的 方法 就 是 神经 网 络 , 深度 OH/4 双 2 
学 习 (Deep Leaming) 就 是 具有 多 隐 含 层 的 神经 网 络 结构 。 ， 

本 章 案例 将 采用 深度 学 习 框架 ， 使 用 卷 积 神经 网 络 (CNN) 对 191 于 号 体 数 了 
MNIST 数据 集 进行 训练 ,最终 给 计算 机 一 个 任意 书写 的 手写 体 数字 , 使 它 能 够 识别 出 该 数 
字 是 什么 。 


19.2 深度 学 习 的 概念 及 关键 技术 


深度 学 习 (Deep Leaming) 是 机 器 学 习 (Machine Leaming) 研究 中 的 一 个 新 领域 ， 是 
具有 多 隐 含 层 的 神经 网 络 结构 。 


19.2.1 神经 网 络 模 型 


@ 生物 神经 元 
大 脑 大 约 由 140 亿 个 神经 元 组 成 ， 神 经 元 互相 连接 成 神经 网 络 ， 每 个 神经 元 平均 连接 
几 干 条 其 他 神经 元 。 神 经 元 是 大 脑 处 理 信息 的 基本 单元 。 一 个 神经 元 的 结构 如 图 19-2 所 示 。 
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图 19-2 生物 神经 元 结构 


可 以 看 到 ， 一 个 可 视 化 的 生物 神经 元 是 由 细胞 体 、 树 突 和 轴 突 三 部 分 组 成 。 以 细胞 体 
为 主体 ， 由 许多 向 周围 延伸 的 不 规则 树枝 状 纤维 构成 ， 其 形状 像 一 棵 枯 树 的 枝 干 。 其 中 ， 
轴 突 负责 细胞 体 到 其 他 神经 元 的 输出 连接 ， 树 突 负责 接收 其 他 神经 元 到 细胞 体 的 输入 。 来 
自 神经 元 ( 突 触 〉 的 电化 学 信号 聚集 在 细胞 核 中 ， 如 果 聚 合 超过 了 突 触 六 值 ， 那 么 电化 学 
尖峰 〈 突 触 ) 就 会 沿 着 轴 突 向 下 传播 到 其 他 神经 元 的 树 突 上 。 

由 于 神经 元 结构 的 可 塑性 ， 突 触 的 传递 作用 可 增强 或 减弱 ， 因 此 神经 元 具有 学 习 与 遗 
忘 的 功能 。 

@ 人 工 神经 网 络 

人 工 神 经 网 络 是 反映 人 脑 结构 及 功能 的 一 种 抽象 数据 模型 ， 它 使 用 大 量 的 人 工 神 经 元 
进行 计算 ， 该 网 络 将 大 量 的 “神经 元 ”相互 连接 ， 每 个 “神经 元 ”是 一 种 特定 的 输出 函数 ， 
又 称 为 激活 函数 。 每 两 个 “神经 元 ”之 间 的 连接 都 通过 加 权 值 ， 称 为 权重 ， 这 相当 于 人 工 
神经 网 络 的 记忆 。 网 络 的 输出 则 根据 网 络 的 连接 规则 来 确定 ， 输 出 因 权重 值 和 激励 函数 的 
不 同 而 不 同 。 

一 个 简单 的 人 工 神经 网 络 如 图 19-3 所 示 ， 其 中 ，x1(0) 等 数据 为 这 个 神经 元 的 输入 ， 代 
表 其 他 神经 元 或 外 界 对 该 神经 元 的 输入 ; @, 等 数据 为 这 个 神经 元 的 权重 ，u = y ou x,(t) 


是 对 输入 的 求 和 ; y;(t)=f(ui(t)) 称 为 激励 函数 , 是 对 求 和 部 分 的 再 加 工 , 也 是 最 终 的 输出 。 

因此 ,神经 网 络 就 是 将 许多 单一 的 神经 元 连接 在 一 起 的 一 个 典型 的 网 络 ， 如 图 19-4 所 
示 ， 用 更 多 的 神经 元 去 进行 学 习 ， 神 经 网 络 最 左边 的 一 层 叫 输入 层 ， 它 有 3 个 输入 单元 ; 
最 右边 的 一 层 叫 输出 层 ， 它 只 有 一 个 结 点 ;中 间 两 层 称 为 隐藏 层 ， 因 为 用 户 不 能 在 训练 过 
程 中 观测 到 它们 的 值 。 其 实 ， 神 经 网 络 可 以 包 舍 更 多 的 隐藏 层 。 


19.2.2 ”深度 学 习 之 卷 积 神经 网 络 


深度 学 习 的 概念 源 于 人 工 神经 网 络 的 研究 ， 含 有 多 隐 层 的 神经 网 络 就 。“”““ 
是 一 种 深度 学 习 结构 。 深 度 学 习 通 过 组 合 低层 特征 形成 更 加 抽象 的 高 层 表 。。“ 癌 中 包 
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示 属 性 类 别 或 特征 ， 以 友 现 数据 的 分 布 式 特征 表示 。 


Xi(t) i 
x2(t) J 


CDi2 


xs(b) 


X4(t) 


xs(t) 


图 19-3 ”人工 神 经 网 络 图 19-4 神经 网 络 典型 结构 


深度 学 习 中 的 卷 积 神经 网 络 (CNN) 近年 来 有 了 非常 出 色 的 表现 ， 它 与 普通 的 神经 网 
络 的 区 别 在 于 包含 了 一 个 由 卷 积 层 和 池 化 层 构 成 的 特征 抽取 器 。 在 卷 积 神经 网 络 的 卷 积 层 
中 ， 一 个 神经 元 只 与 部 分 邻 层 神经 元 相连 接 ， 通 常 包 含 耕 干 个 特征 图 (Feature Map)， 每 
个 特征 平面 由 一 些 矩 形 排列 的 神经 元 组 成 。 同 一 特征 平面 的 神经 元 共享 权 值 ， 这 里 共享 的 
权 值 就 是 卷 积 核 ， 卷 积 核 一 般 以 随机 小 数 和 矩阵 的 形式 初始 化 ， 在 网 络 的 训练 过 程 中 卷 积 核 
将 学 习 得 到 合理 的 权 值 。 共 享 权 值 〈 卷 积 核 ) 斋 来 的 直接 好 处 是 减少 了 网 络 各 层 之 间 的 连 
接 ， 同 时 又 降低 了 过 拟 合 的 风险 。 池 化 也 叫 子 采样 〈Pooling)， 可 以 看 作 一 种 特殊 的 卷 积 
过 程 。 卷 积 和 池 化 大 大 简化 了 模型 复杂 度 ， 减 少 了 模型 的 参数 。 

下 面具 体 介 绍 几 个 相关 概念 。 

@ 卷 积 

这 里 用 一 个 简单 的 例子 来 讲述 如 何 计 算 卷 积 ， 假 设 有 一 个 5x5 的 图 像 ， 使 用 一 个 3x3 
的 卷 积 核 〈filter) 进行 卷 积 ， 想 得 到 一 个 3x3 的 Feature Map， 首 先 对 图 像 的 每 个 像素 进行 
编号 ， 用 xi 表示 图 像 的 第 1 行 第 j 列 元 素 ， 对 filter 的 每 个 权重 进行 编号 ， 用 wmn 表 示 第 
m 行 第 na 列 的 权重 ， 对 Feature Map 的 每 个 元 系 进 行 编写， 用 aij 表示 第 1 行 第 ] 列 元 素 。 

那么 Feature Map 中 aoo 的 卷 积 计算 方法 如 下 ， 如 图 19-5 所 示 。 


image 5x5 filter 3x3 Feature Map 3x3 


图 19-5 卷 积 原理 图 ] 


30.0 二 0O0.0X0.0 十 0.1X0.1 十 Oo.2Xo2 十 OO1.0X1.0+O1.1X1.1 十 O1.2X1.2 十 2.0X2.0 二 GOD2.1X2.1 十 QO2.2X2.2 
二 1]x1+0x]1+1x1l+0O0x0+1x1l+0O0x1l+1xO+Ox0o+1xj 
-4 
Feature Map 中 aol 的 卷 积 计算 方法 如 下 ， 如 图 19-6 所 示 。 
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ao .1 二 Oo.1Xo 1 十 Oo 2Xo 2 十 Oo 3X0 3 十 O11X1.1 十 O1 2X12 十 O1.3X1 .3 十 O2 1X2 1 十 O2 2X2 2 十 2 3X2 3 
三 1]x1+TOx1+1x0O+O0x1l+1x1l1+0O0x1l+1x0O+0O0xl+lxl 
一 3 


bias=0 


image $x5 filter 3x3 Feature Map 3x3 
图 19-6 卷 积 原理 图 2 


同 理 ， 依 次 计算 出 Feature Map 中 所 有 元 素 的 值 。 

在 上 和 面 的 计算 过 程 中 ， 步 幅 (stride) 为 1， 步 幅 可 以 设 为 大 于 1 的 数 。 例 如 ， 当 步 幅 
为 2 时 filter 将 每 次 滑动 两 个 元 素 ， 因 此 Feature Map 就 变 成 了 2x2。 这 说 明 图 像 大 小 、 步 
幅 和 卷 积 后 的 Feature Map 大 小 是 有 关系 的 ， 这 里 将 不 再 举例 。 

上 例 仅 演 示 了 一 个 filter 的 情况 ， 其 实 每 个 卷 积 层 可 以 有 多 个 filter， 每 个 filter 和 原始 
图 像 进行 卷 积 后 都 可 以 得 到 一 个 Feature Map， 因 此 卷 积 后 Feature Map 的 深度 (个 数 ) 和 
卷 积 层 的 filter 个 数 是 相同 的 。 图 19-7 所 示 为 3 个 24x24 大 小 的 filter〈 即 3x24x24) 得 到 
的 三 维 的 Feature Map。 


28x28 Input neurons first hidden layer: 3x24x24 neurons 


r 一 -- 一 -- 一 - -一 -- 一 - -一 - -一 -- 一 - -一 - -一 -- 一 - -一 -- 


图 19-7 多 个 卷 积 核 


以 上 就 是 卷 积 层 的 计算 方法 ， 这 里 体现 了 局 部 连接 和 权 值 共享 : 每 层 神 经 元 只 和 上 一 
层 部 分 神经 元 相连 〈 卷 积 计 算 规 则 )， 且 filter 的 权 值 对 于 上 一 层 所 有 神经 元 都 是 一 样 的 。 

@ 池 化 (Pooling ) 

Pooling 层 的 主要 作用 是 下 采样 ， 通 过 去 挥 Feature Map 中 不 重要 的 样本 进一步 减少 参 
数 数量 ， 且 可 以 有 效 地 防止 过 拟 合 。Pooling 的 方法 很 多 ， 最 常用 的 是 最 大 池 化 (Max 
Pooling)。 最 大 池 化 实际 上 就 是 在 nxn 的 样本 中 取 最 大 值 ， 作 为 采样 后 的 样本 值 。 

图 19-8 是 2x2 步 幅 为 2 的 最 大 池 化 ， 即 在 获取 的 Feature Map 中 每 2x2 的 矩阵 内 取 最 
大 值 作为 采样 后 的 结果 ， 这 样 能 把 数据 缩小 至 114， 同 时 又 不 会 损失 太 多 信息 。 

对 于 深度 为 D 的 Feature Map， 各 层 独 立 做 Pooling， 因 此 Pooling 后 的 深度 仍然 为 D。 
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Max(1,1.3,6)=06 


max pool with 2x2 filters 
and stride 2 


Rectified Feature Map 


图 19-8 池 化 


全 激活 函数 

激活 函数 的 作用 是 能 够 给 神经 网 络 加 入 一 些 非 线性 因素 , 使 得 神经 网 络 可 以 更 好 地 解决 较 
为 复杂 的 问题 。 常见 的 激活 函数 有 Sigmoid0、tanhO0、ReLUO 等 ， 这 里 简要 介绍 两 个 常用 的 
冰 数 Sigmoid0 和 ReLUO。 

1 ) Sigmoid(0 〇 函数 

其 表达 式 如 下 : 


2(Z) = 一 一 一 
l+e 


其 中 ，z 是 一 个 线性 组 合 ， 比 如 2z 可 以 等 于 wo 十 Wixxi + w2xxz。 通 过 代入 很 大 的 正 数 或 很 
小 的 负数 到 函数 中 可 知 ，g(z) 的 结果 趋 近 于 0 或 1。 
因此 ，Sigmoid0) 函 数 的 图 形 表示 如 图 19-9 所 示 。 
也 就 是 说 ，Sigmoid0) 函 数 的 功能 是 把 一 个 实 
数 压缩 至 0 一 1。 当 输入 非常 大 的 正 数 时 ， 输 出 结 
果 会 接近 1; 当 输 入 非常 大 的 负数 时 ， 则 会 得 到 
接近 0 的 结果 。 压 缩 至 0 一 1 的 作用 是 可 以 把 激活 
函数 看 作 一 种 “分 类 的 概率 ”， 比 如 激活 函数 的 输 
出 为 0.9， 便 可 以 解释 为 90% 的 概率 为 正 样本 。 
2) ReLUO 函 数 


[0 (x<0) 图 19-9 Sigmoid0 函 数 图 形 
lx (x>0) 


在 ReLUO 函 数 中 , 当 x<0 时 函数 值 为 0, 人 否则 仍 为 x ReLUO 函 数 的 图 形 表示 如 图 19-10 
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所 示 。 


图 19-10 ”ReLUO 函 数 图 形 


与 Sigmoid0 和 ReLUO 函 数 相 比 ，Sigmoid0 函 数 在 输入 参数 太 大 或 太 小 时 ， 会 产生 梯 
度 消失 现象 ， 而 ReLUO 对 于 随机 梯度 下 降 的 收敛 有 巨大 的 加 速 作 用 ， 且 ReLUO 只 需要 一 
个 国 值 就 可 以 得 到 激活 值 ， 而 不 用 进行 一 大 堆 复 杂 的 (指数 ) 运算 。 但 ReLUO 的 缺点 是 ， 
它 在 训练 时 比较 脆弱 ， 容 易 形 成 不 可 逆转 的 死亡 ， 导 致 了 数据 多 样 化 的 丢失 。 

@ 卷 积 神经 网 络 的 网 络 结构 

一 个 卷 积 神经 网 络 通常 由 铬 干 卷 积 层 、Pooling 层 、 全 连接 层 组 成 。 用 户 可 以 构建 各 种 
不 同 的 卷 积 神经 网 络 。 图 19-11 所 示 为 一 个 常见 的 卷 积 神经 网 络 模型 。 


Cl 
Input 


Output 


Full 


Convolution ; 
Pooling Connected 


Convolution 


Pooling 
+ReLU +ReLU 


图 19-11 一 个 典型 的 CNN 网 络 结构 


其 中 ，Input 为 输入 图 像 ， 被 计算 机 理解 为 算 阵 ， 输 入 图 像 通 过 6 个 可 训练 的 filter 进 
行 卷 积 , 卷 积 后 产生 6 个 特征 图 (Feature Map), 然 后 再 使 用 ReLUO 函 数 得 到 Cl 层 的 Feature 
Map， 在 卷 积 层 后 面 是 池 化 〈Pooling) 得 到 S2 层 。 卷 积 层 + 池 化 层 的 组 合 可 以 在 隐藏 层 出 
现 很 多 次 ， 例 如 图 19-11 中 出 现 了 两 次 ， 实 际 上 这 个 次 数 是 根据 模型 的 需要 而 来 的 。 用 户 
还 可 以 灵活 使 用 卷 积 层 + 卷 积 层 或 者 卷 积 层 + 卷 积 层 + 池 化 层 的 组 合 ， 这 些 在 构建 模型 的 时 
候 没 有 限制 ， 但 是 最 常见 的 CNN 都 是 大 干 卷 积 层 + 池 化 层 的 组 合 ， 如 图 19-11 中 的 CNN 
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结构 。 

在 知 干 卷 积 层 + 池 化 层 后 面 是 全 连接 层 (Full Connected Layer，FC )， 全 连接 层 其 实 就 
是 传统 的 神经 网 络 结构 ， 即 前 一 层 的 每 一 个 神经 元 都 与 后 一 层 的 所 有 神经 元 相连 ， 在 整个 
卷 积 神经 网 络 中 起 到 “分 类 器 ”的 作用 。 


19.3 Python 深度 学 习 库 一 Keras 


Keras 是 搭建 在 theano/tensorflow 基础 上 的 深度 学 习 框 架 ， 用 Python ”视频 讲解 
语言 编写 ， 是 一 个 高 度 模块 化 的 神经 网 络 库 ， 文 持 GPU 和 CPU。 


19.3.1 Keras 的 安装 


@ 在 Windows 下 安装 Keras 
在 安装 Keras 之 前 需要 安装 tensorflow、numpy、matplotlib、scipy 等 库 。 


pip install numpy 
pip install matplotlib 
pip install scipy 
pip install tensorflow 


pip install keras 


@ 使 用 Anaconda 安装 Keras 

在 “https:/www.continuum.io/downloads/” 下 载 对 应 系统 版 本 的 Anaconda， 和 安装 普 
通 的 软件 一 样 , 全 部 选择 默认 即 可 , 注意 勾 选 将 Python3.6 添加 进 环境 变量 , 这 样 Anaconda 
就 安装 好 了 。 

打开 Anaconda 六 单 中 的 Anaconda Prompt， 输 入 : 


pip install --upgdrade --ignore-installed tensorflow 
pip install keras 


© 测试 
安装 完成 后 ， 在 命令 行 下 输入 “python”， 进 入 Python 环境 后 输入 : 


import numpy 
import scipy 
import tensorflow as tf 


import keras 


右 没 有 错误 提示 ， 则 表示 安装 完成 。 
19.3.2 Keras 的 网 络 技 
Keras 的 层 主 要 包括 第 用 层 〈Core)、 卷 积 层 〈Convolutional)、 池 化 层 (Pooling)、 局 
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部 连接 层 、 递 归 层 (Recurrent)、 舱 入 层 (Embedding)、 高 级 激活 层 、 规 范 层 、 噪 声 层 、 
包装 层 ， 当 然 用 户 也 可 以 编写 目 己 的 层 。 


对 于 层 的 操作 如 下 : 

layer.get weights () # 返 回 该 层 的 权重 (numpy array) 
layer.set weights (weights) # 将 权重 加 载 到 该 层 
config=layer.get config() # 保 存 该 层 的 配置 
layer=layer from config (config) # 加 载 一 个 配置 到 该 层 


# 如 果 层 仅 有 一 个 计算 结 点 〈( 即 该 层 不 是 共享 层 )， 则 可 以 通过 下 列 方法 获得 输入 张 量 、 输 出 张 量 、 

# 输 入 数据 的 形状 和 输出 数据 的 形状 

layer.input 

layer.output 

layer.input shape 

layer.output shape 

# 如 果 该 层 有 多 个 计算 结 点 ， 可 以 使 用 下 面 的 方法 

layer.get input at(node index) 

layer.get output at (node index) 

layer.get input shape at (node index) 

layer.get output shape at (node index) 

下 面 介 绍 本 草案 例 中 所 使 用 的 网 络 层 。 

@ 一 维 卷 积 层 

二 维 卷 积 层 是 对 图 像 的 卷 积 。 该 层 对 二 维 输入 进行 滑动 窗 卷 积 ， 当 使 用 该 层 作 为 第 1 
层 时 ， 应 提供 input shape 参数 。 例 如 input shape=(128,128,3) 代 表 128x128 的 彩色 RGB 图 
像 (data format='channels last')。 

操作 如 下 : 

keras.layers.convolutional.Conv2D (filters, kernel size, strides=(1, 1), 

padding="'valid', data format=None, dilation rate=(1, 1), activation=None, 

use bias=True, kernel initializer="'glorot uniform', 


bias initializer='zZeros', kernel regularizer=None, bias regularizer=None, 
activity regularizer=None, kernel constraint=None, bias constraint=None) 


参数 如 下 。 

。 filters: 卷 积 核 的 数目 〈 即 输出 的 维度 )。 

。 kernel size: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 卷 积 核 的 宽度 和 长 度 。 如 为 单 
个 整数 ， 则 表示 在 各 个 空间 维度 的 相同 长 度 。 

strides: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 是 卷 积 的 步 长 。 如 果 为 单个 整数 ， 
则 表示 在 各 个 空间 维度 的 相同 步 长 。 任 何不 为 1 的 strides 与 任何 不 为 1 的 dilation_ 
rate 均 不 兼容 。 

padding: 补 0 策略 ， 为 "valid' 或 'same'。'"valid' 代 表 只 进行 有 效 的 卷 积 ， 即 对 边界 数据 
不 处 理 。'same' 代 表 保 留 边界 处 的 卷 积 结果 , 通常 会 导致 输出 shape 与 输入 shape 相同 。 
activation : 激活 函数 ， 为 预定 义 的 激活 函数 名 (参考 激活 函数 ) 或 逐 元 素 
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(element-wise) 的 Theano 函数 。 如 果 不 指定 该 参数 ， 将 不 会 使 用 任何 激活 函数 〈( 即 
使 用 线性 激活 函数 : a(x)=x)。 

dilation rate: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 指 定 dilated convolution 中 的 
膨胀 比例 。 任 何不 为 1 的 dilation rate 与 任何 不 为 1 的 strides 均 不 兼容 。 

data format: 字符 串 ，'channels first' 或 '(channels last 之 一 ， 代 表 图 像 的 通道 维 的 位 
置 。 该 参数 是 Keras 1.x 中 的 image dim ordering，'channels last' 对 应 原本 的 'tf， 
'channels first' 对 应 原本 的 'th'。 以 128x128 的 RGB 图 像 为 例 ，'channels first 应 将 数 
据 组 织 为 (3,128,128)， 而 'channels last 恬 将 数据 组 织 为 (128,128,3)。 该 参数 的 默认 值 
是 ~/.keras/keras.json 中 设置 的 值 ， 硅 从 未 设置 过 ， 则 为 'channels last'。 

use_bias: 布尔 值 ， 是 否 使 用 偏 置 项 。 

kernel initializer: 权 值 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初始 
化 权重 的 初始 化 器 。 

bias_initializer: 偏 置 器 量 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 回 量 的 初始 化 右 。 

kernel regularizer: 施加 在 权重 上 的 正则 项 ， 为 Regularizer 对 象 。 

bias_regularizer: 施加 在 偏 置 句 量 上 的 正则 项 ， 为 Regularizer 对 象 。 
activity_regularizer: 施加 在 输出 上 的 正则 项 ， 为 Regularizer 对 象 。 

kernel constraint: 施加 在 权重 上 的 约束 项 ， 为 Constraint 对 象 。 

bias_constraint: 施加 在 偏 置 上 的 约束 项 ， 为 Constraint 对 象 。 


@ Dense 层 (全 连接 层 ) 
操作 方法 如 下 : 


keras.layers.core.Dense (units,activation=None,use bias=True, kernel 


initializer='glorot uniform',bias initializer="'zeros',kKkernel regularizer= 
None,bias regularizer=None,activity regularizer=None, kernel constraint= 


None,bias constraint=None) 


参数 如 下 。 

。units: 大 于 0 的 整数 ， 代 表 该 层 的 输出 维度 。 

e。 use bias: 布尔 值 ， 是 人 否 使 用 偶 置 项 。 

kerel initializer: 权 值 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初始 


化 权重 的 初始 化 器 。 
。 bias initializer: 偏 置 回 量 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 器 量 的 初始 化 器 。 


regularizer: 正则 项 ，kemel 为 权重 的 ，bias 为 偏执 的 ，activity 为 输出 的 。 
constraint: 约束 项 ，kernel 为 权重 的 ，bias 为 偏执 的 。 

人 Activation 层 

操作 方法 如 下 : 

keras.layers.core.Activation (activation) 

激活 层 对 一 个 层 的 输出 施加 激活 函数 。 

activation 是 将 要 使 用 的 激活 函数 ， 为 预定 义 激活 函数 名 或 一 个 Tensorflow/Theano 的 
组 数 。 
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输入 shape 任意 ， 当 使 用 激活 层 作 为 第 1 层 时 要 指定 input_shape。 

输出 shape 与 输入 shape 相同 。 

@ 最 大 池 化 层 MaxPooling2D 

操作 方法 如 下 : 

keras.1Layers.poollng.MaxPoollngqd2D(Pool size=(2,2),strides=None,padding= 


'valid', data format=None) 


参数 如 下 。 

e。 pool size: 整数 或 长 为 2 的 整数 tuple， 代 表 在 两 个 方 回 ( 竖 直 、 水 平 ) 上 的 下 采样 
因子 ， 例 如 取 (2,2) 将 使 图 片 在 两 个 维度 上 均 变 为 原 长 的 一 半 。 它 为 整数 ， 意 为 各 个 
维度 值 相同 且 为 该 数字 。 

。 strides: 整数 或 长 为 2 的 整数 tuple， 或 者 为 None， 步 长 值 。 

。 padding: "valid' 或 者 'same'。 

。 data format: 字符 串 ，'channels first' 或 "channels last 之 一 ， 代 表 图 像 的 通道 维 的 位 
置 。 该 参数 是 Keras 1.x 中 的 image dim ordering，'channels last' 对 应 原本 的 'tf， 
'channels first 对 应 原本 的 ' 耻 '。 


19.3.3 用 Keras 构建 神经 网 络 


用 Keras 构建 网 络 的 过 程 可 用 图 19-12 所 示 。 


天 模 
/step1: 选择 模型 和男 数 式 模型 
1/ N EETTIIETTIIITEEY 
| `、、 i ee, 
| \ : 栓 入 层 :| ; 看 人 的 丽 烧 : 
| | : 激活 函数 
| step2: 构建 网 络 屋 于 ; 隐藏 层 : : a : 
1 输出 层 ; | ; 约束 项 
Seveeseeoeee wrrrrrrrrrrrrrrrrr, 
*、 
| LF onenewaynaeyy N 四 ee 
口 - 优化 到 : ”每 层 都 可 以 包括 各 种 网 络 层 党 用 导 
N 


全 人 ET : 
人 Dj i ri 
| \ CO eeeeseeeeeees : 循 Ff 不 屋 : 
\ ~ : 
| 二 训练 “|e.; 回调 函 到 Fi : 
\ EE 的 we ; - 一 一 EEEEEEEEE : 
\ ey: 首相 类 所 "roererrerrerre, , 
ee | 提供 格式 化 数据 、 Pr 


数据 预 处理 : : 文本 预 处 理 ; 
上 图 片 预 处 理 : 


图 19-12 用 Keras 搭建 神经 网 络 
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下 面 以 一 个 简单 的 例子 演示 使 用 Keras 如 何 构 建 网 络 结构 并 进行 训练 及 预测 。 
首先 引入 库 ， 并 建立 一 个 顺序 模型 ，Sequential 就 是 一 个 空 的 网 络 结构 ， 方 法 如 下 : 


from keras.models import Sequential 


model=Sequential () 


在 Keras 里 面 可 以 构建 一 些 其 他 的 网 络 结构 ， 仅 需要 写 .add， 后 面 加 入 层 的 类 型 即 可 。 
下 例 中 引入 了 Dense (也 就 是 fc 层 ) 和 激活 了 图 数 层 (RELU): 

from keras.layers import Dense, Activation 

# 下 分别 adqd fc、relu、fc、softmax 层 

model.add (Dense (units=64, input dim=100)) 

model add(nectivationt reln"y) 

model .add (Dense (units=10)) 


model .add (Activation ("softmax"™)) 
编译 模型 ， 损 失 函 数 loss 用 交叉 燃 ， 优 化 器 用 sgd， 评 估 用 accuracy: 


model.compile (loss="'categorical crossentropy', optimizer='sgd', metrics= 


["accuracy 1] ) 

载 入 训练 数据 集 进行 训练 : 

model.fit (x train, y train, epochs=5, batch size=32) 
对 测试 集 进行 如 下 操作 : 


evaluate loss and metrics = model.evaluate(x test, y test, batch size=128) 


19.4 程序 设计 的 思路 i 


@ 数据 集 描述 视频 讲解 

在 本 实例 中 ， 训 练 样本 和 识别 测试 数据 都 是 28x28 像素 ， 如 图 19-13 
所 示 的 图 片 ， 它 在 计算 机 中 的 存储 是 一 个 二 维和 矩阵 ，0 代表 白色 ，1 代表 黑色 ， 小 数 代 表 某 
程度 的 灰色 。 那 么 输入 层 就 应 该 是 28x28=786 个 神经 元 (忽略 它 的 二 维 结构 )， 其 中 每 个 
神经 元 的 输入 数据 就 是 该 像素 的 灰 度 值 。 整 个 数据 集 被 分 成 两 部 分 ， 即 60000 行 的 训练 数 
据 集 和 10000 行 的 测试 数据 集 ，60000 行 的 训练 数据 集 是 一 个 形状 为 [60000,784] 的 张 量 ， 
第 1 个 维度 数字 用 来 索引 图 片 ， 第 2 个 维度 数字 用 来 案 引 每 张 图 片 中 的 像素 点 。 在 此 张 量 
中 的 每 一 个 元 素 都 表示 有 茶 张 图 片 中 的 茶 个 像素 的 强度 值 ， 值 的 取 值 范围 为 0 一 1。 

输出 结果 只 有 10 个 数字 〔 即 10 类 )， 输 出 层 是 10 个 神经 元 ， 每 个 神经 元 对 应 一 个 要 
识别 的 结果 。 

@ 网 络 结构 

网 络 层 级 结构 概述 :5 层 神 经 网 络 。 

输入 层 : 输入 数据 为 原始 训练 图 像 。 

第 一 卷 积 层 : 6 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ， 输 入 为 28x28 的 深度 
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为 1 的 图 片 数 据 ， 输 出 为 24x24 的 深度 为 6 的 特征 图 。 
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图 19-13 输入 图 像 


第 一 池 化 层 : 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 
24x24 的 深度 为 6 的 特征 图 ， 输 出 为 12x12 的 深度 为 6 的 特征 图 。 

第 二 卷 积 层 : 12 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ， 输 入 为 12x12 的 深 
度 为 6 的 图 片 数 据 ， 输 出 为 8x8 的 深度 为 12 的 特征 图 。 

第 二 池 化 层 : 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 
8x8 的 深度 为 12 的 特征 图 ， 输 出 为 4x4 的 深度 为 12 的 特征 图 。 

输出 层 : 输出 为 10 维 回 量 ， 激 活 函 数 为 sigmoid。 

全 代码 流程 简 述 

(1) 获取 训练 数据 和 测试 数据 。 

(2) 训练 网 络 的 超 参数 的 定义 (学 习 率 ， 每 次 迭代 中 训练 的 样本 数目 ， 达 代 次 数 )。 

(3) 构建 网 络 层 级 结构 。 

(4) 编译 模型 。 

(5) 训练 模型 。 

(6) 网 络 模 型 评估 。 


19.5 ”程序 设计 的 步 又 


19.5.1 MNIST 数据 集 


MNIST (Mixed National Institute of Standards and Technology database) 是 一 个 计算 机 
视觉 数据 集 , 它 包含 70000 张 手 与 数字 的 灰 度 图 片 , 其 中 每 一 张 图 片 包含 28x28 个 像 系 点 。 

手写 体 数据 集 (MNIST) 文件 的 下 载 如 下 。 

训练 集 样本 : tl0k-images.idx3-ubyte (下 载 地 址 为 “http:/Wluanpeng.oss-cn-qingdao. 
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aliyuncs.com/csdn/python/%oE6%89%8BY%ESY%86%99%EA4Y%BDY%93%E6%9S%BOW%E6%S8D% 
AE/tl0k-images.1dx3-ubyte )。 

训练 集 标签 :tl10k-labels.idx1-ubyte( 下 载 地 址 为 “http://Iluanpeng.0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%oE6%89%8B%ESY86%99%E4Y%BDY93%E6%9S%BOWE6Y%SDY%AE/tl Ok- 
labels.1dxl1-ubyte )。 

测试 集 样本 : train-images.idx3-ubyte (下 载 地 址 为 “http://luanpeng.0ss-cn-qingdao. 
aliyuncs.com/csdn/python/%E6%89%8BY%ESY%S86%99%EAY%BDY%93%E6%9S%BO%E6%SD% 
AFE/train-i1mages.1dx3-ubyte” )。 

测试 集 标签 :train-labels.idx1-ubyte( 下 载 地 址 为 “http://luanpeng.0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%oE6%89%8B%ESY%86%99%E4%BDY93%E6%9S%BOW%E6Y%S8D%AE/tramn- 
labels.1dx1l-ubyte” )。 


19.5.2 手写 体 识 刑 双 例 实现 


@ 读 取 MNIST 数据 集 

编写 文件 MNISTpy， 用 于 获取 手写 图 像 数据 ， 每 张 图 像 是 28x28 像素 大 小 ， 根 据 需 
要 转换 成 长 度 为 784 的 行 向 量 。 

每 个 对 象 的 标签 为 0 一 9 的 数字 ，one-hot 编码 成 10 维 的 向 量 。 


#MNIST.py 文件 
import numpy as np 
# 数 据 加 载 器 基 类 ， 派 生出 图 片 加 载 器 和 标签 加 载 器 
class Loader (object): 
# 初 始 化 加 载 器 ，path 为 数据 文件 路 径 ，count 为 文件 中 的 样本 个 数 
def init (self, path, count): 
self .path=path 
self .count=count 
# 读 取 文 件 内 容 
def get file content (self): 
print (self .path) 
=open (self .path, ‘rb'") 


content =Fereadl) # 读 取 字 节 流 
f.close!() 
return content # 字 节 数 组 

# 图 像 数 据 加 载 器 


class ImageLoader (Loader): 


# 内 部 函数 ， 从 文件 字 节 数组 中 获取 第 index 个 图 像 数据 ， 文 件 中 包含 所 有 样本 图 片 的 数据 


def get picture(self, content, index): 
start=ijndex*28*28+16 


# 文 件 头 16 字 节 , 后 面 每 28x28 个 字 节 为 一 个 图 片 数据 
picture=[] 


for 1 in range(28): 
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picture .append([] ) # 图 片 添 加 一 行 像素 
for ] in range(28) : 
bytel = content[start+i*28+]] 
picture[i] .append (bytel) # 在 Python3 中 本 来 就 是 int 
#picture[i]l.append(self.to int (bytel)) # 添 加 一 行 的 每 一 个 像素 
return picture 
I A | 
# 将 图 像 数 据 转 化 成 长 度 为 784 的 行 回 量 形式 
def get one sample (self, picture): 
sample=[] 
for 1 in range (28): 
for ] in range (28): 
sample.append (picture[i][]j]]) 
return sample 


# 加 载 数 据 文 件 ， 获 得 全 部 样本 的 输入 向 量 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向量 ，to2 


# 表 示 是 否 转 化 为 0, 1 矩阵 

def load(self,onerow=False): 
content=self :get file content() # 获 取 文 件 字 节 数组 
data set=[] 
for index in range(self.count): # 遍 历 每 一 个 样本 


onepic=self.get picture (Content， index) 
# 从 样本 数据 集中 获取 第 index 个 样本 的 图 片 数 据 ， 返 回 的 是 二 维 数 组 
if onerow: onepic=self.get one sample (onepic) 
# 将 图 像 转化 为 一 维 回 量 形 式 
data set .append (onepic) 
return data set 
# 标 签 数 据 加 载 器 
class LabelLoader (Loader): 
# 加 载 数据 文件 ， 获 得 全 部 样本 的 标签 癌 量 
def load(self): 


content=self.get file content() # 获 取 文 件 字 节 数组 

labels=[] 

for index in range (self.count): # 遍 历 每 一 个 样本 
onelabel=content[index + 8] 文件 头 有 8 个 字 节 
Onelabelvec=selft.norm(onelabel) #one-hot 编码 


labels .append (onelabelvec) 
return labels 
# 内 部 函数 ，one-hot 编码 ， 用 于 将 一 个 值 转换 为 10 维 标签 向 量 
def norm(self, label): 
label vec=[| 
ele selF EOInttiaber 
label value=label # 在 Python3 中 直接 就 是 int 


for 1 in range(10): 
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if i==label value : 
label vec-append (1) 
else: 
label vec.append (0) 
return label vec 
# 获 得 训练 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 回 量 
def get training data set (num,onerow=False): 
image loader=ImageLoader('train-images.1idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader ('traln-1labels.1dqx1-ubyte'，num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
return image loader.load(onerow), label loader .load () 
# 获 得 测试 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 回 量 
def get test data set (num, Onerow=False) : 
image loader=ImageLoader('tl0k-images.1idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader('tl0k-labels.idxl-ubyte', num) 
# 参 数 为 文件 路 人 径 和 加 载 的 样本 数量 
return image loader.1load (onerow), label loader. lo0ad'() 
# 将 一 个 长 度 为 784 的 行 向 量 打印 成 图 形 的 样式 
def printimg (onepic): 
onepic=onepic.reshape (28,28) 
for 1 In rangel(l28): 
for ] in range (28): 
if oneplc[1I,]]==0: print(' ',end="") 
else: print ('* ',end="") 


euntet 


全 训练 及 测试 数据 集 


import numpy as np 

np.random.seed(1337)  # 可 重 现 性 

from keras.models import Sequential 

from keras.layers import Dense, Dropout, Activation, Flatten 
from keras.layers import Conv2D, MaxPooling2D,AveragePooling2D 
import MNIST 


# 全 局 变量 

batch size=128 # 批 处 理 样 本 数量 

nb classes=10 # 分 类 数目 
epochs=600 # 和 友人 代 次 数 

img rows, img cols=28, 28 # 输 入 图 片 样本 的 宽 、 高 
ny 11lersd2 # 卷 积 核 的 个 数 

pool size=(2, 2) # 池 化 层 的 大 小 
kernel size=(5, 5) # 卷 积 核 的 大 小 

input shape= (Img rows, img cols,1) # 输 入 图 片 的 维度 


| 380 


第 19 草 ”深度 学 习 案 例 一 一 基于 卷 积 神经 网 络 的 手写 体 识别 1 9 


xX train, Y train=MNIST.get training data set (6000, False) 
# 加 载 训练 样本 数据 集 和 one-hot 编码 后 的 样本 标签 数据 集 ， 最 大 为 60000 
X test, Y test=MNIST.get test data set (1000, False,) 
# 加 载 测试 特征 数据 集 和 one-hot 编码 后 的 测试 标签 数据 集 ， 最 大 为 10000 
X train=np.array (X train) .astype (bool) .astype (float)/255 
# 数 据 归 一 化 
XxX train=xX train[:,:,:,np.newaxis] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y train=np.array (Y train) 
x test=np.array (X test) .astype (bool1) .astype (float)/255 # 数 据 归 一 化 
X test=X test[:,:,:,np.newaxils] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y test=np.array(Y test) 
print (' 样 本 数据 集 的 维度 : '， Xx train.shape,Y train.shape) 
print (' 测 试 数据 集 的 维度 : '，X test.shape,Y test.shape) 
# 构 建 模 型 
model=Sequential () 


model .add (Conv2D(6, kernel size,input shape=input shape,strides=1)) 


# 卷 积 层 1 
model .add (AveragePooling2D (pool size=pool size,strides=2)) # 池 化 层 
model .add (Conv2D (12, kernel size,strides=1)) # 卷 积 层 2 
model .add (AveragePooling2D (pool size=pool size,strides=2)) # 池 化 层 
model .add (Flatten () ) # 拉 成 一 维 数据 
model agddiDenseltnb classes)) # 全 连接 层 2 
model.add (Activation('sigmoid"')) #sigmoid 评分 


# 编 译 模 型 

model.compile(loss='categorical crossentropy',optimizer='"'adadelta', 
metrics=["'accuracy'"]) 

# 训 练 模型 

model.fit (x train, Y train, batch size=batch size, epochs=epochs, 
verbose=1, validation data=(X test, Y test)) 

# 评 估 模 型 

score=model .eValuate (X test, Y test, verbose=0) 

print ('Test score:', score[0]) 

print ('Test accuracy:', score[1]) 

# 保 存 模型 

model savet cnn medet .hy #HDF5 文件 ,pip install h5py 


输出 结果 如 下 : 


Test Score: 0.18881544216349722 


Test accuracy: 0 339 


由 于 训练 时 间 太 久 ， 读 者 可 目 行 减少 训练 集 及 测试 集 的 数量 ， 或 者 迭代 次 数 ， 观 察 训 


练 结 朱 。 
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19.5.3 ”预测 自己 手写 图 像 


@ 制作 自己 的 手写 图 像 
使 用 画图 工具 或 Photoshop 制作 一 个 28x28 像素 的 黑 底 白字 的 图 像 文 件 ， 如 图 19-14 
所 示 。 


图 19-14 自己 的 手写 图 像 


@ 编写 代码 
新 建文 件 my predict.py， 编 写 代 码 如 下 : 


from keras.models import load model 
import numpy as np 

import cv2 

model=load model('"'cnn model.h5') 
image=cv2.imread('4.png', 0) 
img=cv2.imread('4.png', 0) 
img=np.reshape (img, (1,28,28,1)) .astype (bool) .astype ("float32")/255 
my proba=model .predict proba (img) 

my predict=model .predict classes (img) 
print (' 识 别 为 :') 

print (my proba) 

print (my predict) 

cv2.imshow ("Imagel", image) 


CVv2 .waitKey (0) 
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20.1 功能 介绍 


“ 词 云 ”就 是 对 网 络 文 本 中 出 现 频率 较 高 的 “关键 词 ”予以 视觉 上 的 突 
出 ， 形 成 “关键 词 云层 ”或 “关键 词 泻 染 ”， 从 而 过 滤 掉 大 量 的 文本 信息 ， 
使 浏览 网 页 者 只 要 一 眼 扫 过 文本 就 可 以 领略 文本 的 主 则 。 

豆 因 电影 提供 了 最 新 的 电影 介绍 及 评论 ， 包 括 上 映 影片 的 影讯 查询 及 购 标 服务， 观众 
可 以 记录 想 看 、 在 看 和 看 过 的 电影 /电视 剧 ， 以 及 打分 、 写 影评 。 豆 光电 影 会 根据 观众 的 口 
味 推荐 好 电影 。 本 程序 使 用 Python 爬虫 技术 获取 豆 办 电影 (https:/movie.douban.com/) 中 
最 新 电影 的 影评 ， 经 过 数据 清理 和 词 频 统计 后 对 电影 《 黑 豹 》 的 影评 信息 进行 词 云 展示 ， 
效果 如 图 20-1 所 示 。 


视频 讲解 


x=398.201 y=83,.6558 [255, 255, 255] 


20-1 《 黑 豹 》 影 评 信息 的 词 云 显示 结果 


| 项 目 案例 开发 
从 人 入门 到 实战 一 爬虫 、 游 戏 和 机 器 学 习 


20.2 ”程序 设计 的 思路 


本 程序 主要 分 为 3 个 过 程 。 

@ 抓 取 网 页 数据 

使 用 Python 息 虫 技术 获取 豆 汰 电 影 中 最 新 上 映 电 影 的 网 页 (如 图 20-2 所 示 )， 其 网 址 
如 下 : 

https://movie.douban.com/cinema/nowplaying/zhengzhou/ 


昌 Z 票 - 郑州 | tm 


正在 上 映 


唐人 街 控 案 2 小 萝 乔 的 猴 宰 大 
信人 娘 娘 直 码 7 1 三 娘 女 女 直 8 6 


购 票 村 选 座 购 票 选 座 购 票 选 座 购 村 
POOR oS HS PPO = 


图 20-2 最 新 上 映 电 影 的 网 页 


通过 其 HTML 解析 出 每 部 电影 的 ID 号 和 电影 名 , 获取 茶 ID 号 就 可 以 得 到 该 部 电影 的 
影评 网 址 ， 形 式 如 下 : 

https://movie.douban.com/subject/26861685/comments 
其 中 ，26861685 就 是 电影 《红海 行动 》 的 ID 号 。 这 样 仅仅 获取 了 20 个 影评 ， 可 以 指定 开 
台 号 start 来 获取 更 多 影评 ， 例 如 : 

https://movie.douban.com/subject/26861685/comments?start=40&limit=20 

这 意味 着 获取 从 第 40 条 开始 的 20 个 影评 。 

全 清理 数据 

通常 将 某 部 影评 信息 存 入 eachCommentList 列表 中 。 为 便于 数据 清理 和 词 频 统计 ， 把 
eachCommentList 列表 形成 字符 串 comments， 将 comments 字符 串 中 的 “也 ”“ 太 ”“ 的 ” 
等 虚词 〈 停 用 词 ) 清理 掉 后 进行 词 频 统计 。 

全 用 词 云 进行 展示 

最 后 使 用 词 云 包 对 影评 信息 进行 词 云 展 示 。 
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20.3 ”关键 技术 


视频 讲解 


20.3.1 安装 WordCloud 


WordCloud 使 用 最 第 规 的 pip install wordcloud 命令 安装 。 

如 果 安 装 失 败 ， 可 以 使 用 Windows 二 进 制 安装 包 (WHL 文件 ) 直接 安装 ， 步 又 如 下 : 

首先 转 到 “http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud” 页 面 ， 下 载 需 要 的 对 
应 版 本 的 WordCloud 的 WHL 文件 。 如 果 用 户 使 用 的 是 64bit 的 Python3.5， 请 下 载 图 20-3 
中 框 住 的 文件 。 


Rordcloud, a little word cloud generator. 
wordcloud-l. 3. 1-cp2r-cp2rm-wino2. whl 
wordcloud-1. 3. 1-cp2r-cp2rm-win amnd6d. whl 
wordcloud-l. 3. 1-cp3d-cp3dm-win32. whl 
wordcloud-l. 3. 1-cp3d-cpsdm-win_amd8d. whl 
wordcloud-l. 3. 1-cp35-cp35m-wln32. whl 
wordcloud-l. 3. 1-cp356-cp3bm-wlno2. whl 
wordcloud-1. 3. 1-cp36-cp36bm-win amd6d. whl 


图 20-3 下载 文件 


然后 在 cmd 命令 行 中 进入 到 刚刚 下 载 的 文件 的 路 径 ， 使 用 pip install 
wordcloud-1.3.1-cp35-cp35m-win amd64.whl 命令 开始 安装 ， 大 约 一 分 钟 就 可 以 安装 完成 。 


20.3.2 ”使 用 WordCloud 


@@ WordCloud 的 基本 用 法 


class wordcloud.WordCloud (font path=None, width=400, height=200, margin=2, 
ranks only=None, prefer horizontal=0.9, mask=None, scale=1, 

color func=None, max words=200, min font size=4, stopwords=None, 

random state=None, background color='"'black', max font size=None, 

font step=1l, mode='RGB', relative scaling=0.5, regexp=None., 


collocations=True, colormap=None, normalize plurals=True) 

这 是 WordCloud 的 所 有 参数 ， 下 面具 体 介 绍 一 下 各 参数 。 

。 font path: 需要 展现 什么 字体 驶 把 该 字体 路 径 + 扩 展 名 与 上 ， 例 如 font path = ' 黑 
体 .ttf'。 

。 width: 输出 的 画布 宽度 ， 默 认为 400 像素 。 
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height: 输出 的 画布 高 度 ， 默 认为 200 像素 。 

prefer_horizontal: 词语 水 平方 回 排 版 出 现 的 频率 ， 默 认为 0.9〈 所 以 词语 垂直 方 回 
排版 出 现 的 频率 为 0.1)。 

mask: 如 采 该 参数 为 衬 ， 则 使 用 二 维 遮 单 绘制 词 云 ;， 如 末 该 参数 非 空 ， 设 置 的 宽 / 
高 值 将 被 忽略 ， 遮 单 形状 将 被 mask 取代 。 除 了 全 和 白 〈 帮 FFFFF) 部 分 不 会 绘制 以 
外 ， 其 余部 分 会 用 于 绘制 词 云 。 例 如 bg pic = imread(" 读 取 一 张 图 片 png)， 背 景 图 
片 的 画布 一 定 要 设置 为 白色 《〈 考 FFFFF)， 然 后 显示 的 形状 为 不 是 白色 的 其 他 颜色 。 
用 户 可 以 用 PS 工具 将 自己 要 显示 的 形状 复制 到 一 个 纯 白 色 的 画布 上 ， 然 后 保存 。 
Scale: 按照 比例 放大 画布 ， 例 如 设置 为 15， 则 长 和 宽 都 是 原来 画布 的 1.3 倍 。 
min font size: 显示 的 最 小 的 字体 大 小 。 

font step: 字体 步 长 ， 如 果 步 长 大 于 1， 会 加 快运 算 ， 但 是 可 能 导致 结果 出 现 较 大 
的 误差 。 

max _ words: 要 显示 的 词 的 最 大 个 数 。 

stopwords: 设置 需要 屏 向 的 词 ， 如 末 为 空 ， 则 使 用 内 置 的 SIOPWORDS。 
background color: 背景 颜色 ， 例 如 background color=-'white'， 背 景 颜色 为 白色 ， 默 
认 颜 色 为 黑色 。 

max_ font_size: 显示 的 最 大 的 字体 大 小 。 

mode: 当 该 参数 为 “RGBA” 并 且 background color 不 为 空 时 背景 透明 。 
relative_scaling: 词 频 和 字体 大 小 的 关联 性 。 

color func: 生成 新 颜色 的 函数 ， 如 果 为 空 ， 则 使 用 self.color func。 

regexp: 使 用 正则 表达 式 分 隔 输 入 的 文本 。 

collocations: 是 否 包括 两 个 词 的 搭配 。 

colormap: 给 每 个 单词 随机 分 配 颜色 ， 知 指定 color func， 则 忽略 该 方法 。 


WordCloud 提供 的 方法 如 下 。 


fit words(frequencies): 根据 词 频 生成 词 云 。 

generate(text): 根据 文本 生成 词 云 。 

generate from frequencies(frequencies|[,….]): 根据 词 频 生成 词 云 。 
generate from text(text): 根据 文本 生成 词 云 。 

process_text(text): 将 长 文本 分 词 并 去 除 屏 贡 词 〈 此 处 指 英 语 ， 中 文 分 词 还 需要 目 己 
用 其 他 库 先 行 实 现 ， 使 用 上 面 的 fit words(frequencies) )。 

recolor([random state,color func,colormap]): 对 现 有 输出 重新 着 色 ， 重 新 着 色 会 比重 
新 生成 整个 词 云 快 很 多 。 

to array(): 转化 为 numpy array。 

to file(filename): 输出 到 文件 。 


人 WordCloud 的 应 用 举例 


# 导 入 wordcloud 模块 和 matplotlib 模块 
from wordcloud import WordCloud, ImageColorGenerator,STOPWORDS 


import matplotlib.pyplot as plt 


from scipy.misc import imread 
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EL # 读 取 一 个 TXT 文件 
bg pic=imread('alice.png') # 读 入 背景 图 片 
1 "设置 词 云 样式 ， rT 


wcC=WordCloudl( 
background color="'white', 
#background color 参数 用 于 设置 背景 颜色 ， 默 认 颜色 为 黑色 
mask=bg pic, 
# 有 中 文 这 句 代码 必须 添加 ， 否 则 会 只 出 现 方 框 而 不 出 现 汉字 
font path="'simhei.ttf', # 通 过 font path 参数 来 设置 字体 集 
max words=2000, 
max font size=150, 


random state=30,scale=1 .95) 


wc.generate from text (text) # 根 据 文本 生成 词 云 
image colors=ImageColorGenerator (bg pic) 

plt.imshow (wc) # 显 示 词 云图 片 
plt=axis (toff”) 

plt.show() 

print ('display success!') 

wc.to file('test2.jpg') # 保 存 图 片 


只 有 在 设置 mask 的 情况 下 才 会 得 到 一 个 拥有 图 片 形状 的 词 云 。 本 程序 使 用 的 模板 图 


是 alice.png( 如 图 20-4 所 示 )， 生 成 的 词 云 形状 如 图 20-5 所 示 。 


图 20-4 ”模板 图 图 20-5 生成 的 词 云图 
全 设置 停 用 词 


用 户 也 可 以 设置 俘 用 词 “ 太 ”“ 的 ”等 虚词 )， 使 得 词 云 中 不 显示 该 虚词 ， 例 如 : 


from os import path 


from PIL import Image 
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import numpy as np 

import matplotlib.pyplot as plt 

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator 
# 读 取 整 个 文章 

Pext em Test ta er rad # 读 取 一 个 TXT 文件 

# 读 取 遮 单 /彩色 图 像 

alice coloring=np.array (Image.open (path.Join(d, "alice color.png"))) 
# 设 置 停 用 词 

stopwords=set (STOPWORDS) 

stopwords .add ("的 ") # 人 工 添加 停 用 词 

stopwords .add ("了") # 人 工 添加 停 用 词 

# 可 以 通过 mask 参数 来 设置 词 云 形状 

wc=WordCloud (background color="white", max words=2000, mask=alice 
coloring, stopwords=stopwords, max font size=40, random state=42) 
# 生 成 词 云 

wc .generate (text) 

# 根 据 图 片 生成 颜色 

image colors=ImageColorGenerator(alice coloring) 

plt.imshow (wc, interpolation="bilinear") 

ER 

plt.show() 


@ WordCloud 使 用 词 频 


import jieba.analyse 
from PIL import Image,ImageSequence 
import numpy as np 
import matplotlib.pyplot as plt 
from wordcloud import WordCloud, ImageColorGenerator 
1yric="" 
f=open('./test.txt"',"'r'") 
Far nt: 
lyric+=f.read() 
# 用 jieba 对 文章 做 分 词 ， 提 取出 词 频 高 的 前 50 个 词 
result=jieba.analyse.textrank (lyric,topK=50,withWeight=True) 
keywords=dict () 
for rT in resnlt: 
keywords [1[0]]=1i[1] 
print (keywords) 


输出 如 下 : 


{' 听见 ':0.26819943990969086,' 风 十 ':0.4369472045572426,， 不 能 ': 
0.41455711258992367,，' 生 命 ':0.5934235845918548，' 理 想 ' :0.26510877668765925, ' 星 河 ': 
0.23975886019089002, ' 青 春 ' :0.24010255181105905,，' 希望 ':0.494835681401572，' 痛 算 ' : 
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0.27939232288036236, ' 梦 想 ' :0.6607157592927637, ' 大 家 ' :0.2630206522238169, ' 日 落 ': 
0.24124829031114808,， 相信 ':1-0,' 随 风 ':0.24679509210701486,， 热血 ，': 
0.3747213789071734,' 怒放 ':0.4236733731776506, ' 不 掉 ':0.37456984152879724,' 卷 起 ': 
0.28349442481975,' 兄弟 ':0.41239452275709515,' 超越 ':0.39647241012049056,' 英雄 ': 
0.313110375266555513, ' 像 是 ' :0.30426828861337796, ' 跌 倒 ' :0.3625975500392993, ' 想 要 ': 
0.5829550209468557,' 命运 ':0.7201128992940313,' 变化 ':0.2686953866879604,' 天空 ': 
0.3146976061015469, ' 父 亲 ' :0.24636152229739733, ' 世 界 ':0.3565812143701714,' 没 有 ': 
0.5977870162380065,' 人 生 ':0.3775236250279759,' 生 活 ':0.2663673685783774,' 改变 ': 
0.8023053505916324,' 和 穿行 ' :0.30336139077497054, ' 海 洋 ' :0.28687650921373503, ' 追 逐 ': 
0.28164694577079186, ' 拥 有 ' :0.5511676957186838, ' 太 阳 ' :0.31281001159455113, ' 知 道 ' : 
0.28305393123835487,' 拍 拍 ':0.2877289851675474,' 摇 摆 ':0.4813790823694424,' 力 量 ': 
0.5692829648461694,，' 翅 膀 ' :0.36632797341678375, ' 朋友"':0.2528034375864833,' 挣 脱 ': 
0.39383738344839236,' 奔跑 ':0.4640807450464461, ' 方 同 ':0.4093246167577443,' 就 算 ': 
0.9832790417761437, ' 水 手 ' :0.3471435439240663, ' 态 记 ' :0.23862724809926258} 

image=Image.open('./tim.png') 

graph=np.array (image) 

wc=WordCloud (font path="'./fonts/simhei.ttf',background color="'White', 

max words=50,mask=graph) 

wc.generate from frequencies (keywords) # 词 频 生 成 词 云 

image color=ImageColorGenerator (graph) 

plt.imshow (wc) 

plt.imshow (wc.recolor (color func=image color)) 

Blt axist"oFf") 

it Showt 


wc.to file('dream.png') 


20.4 ”程序 设计 的 步 又 


@ 抓 取 网 页 数据 视频 讲解 
首先 要 对 网 页 进行 访问 ， 在 Python 中 使 用 的 是 urllib 库 ， 代 码 如 下 : 


from urllib import request 


resp=request .urlopen('https://movie.douban.com/nowplaying/hangzhou/') 
emiveaea resp read( eed UEe 0 


其 中 ,“https://movie.douban.com/cinema/nowplaying/zhengzhou/” 是 豆 办 电影 最 新 上 映 的 电 
影 页 面 ， 用 户 可 以 在 浏览 器 中 输入 该 网 址 进行 查看 ; html_data 是 字符 串 类 型 的 变量 ， 里 面 
存放 了 网 页 的 HTML 代码 。 输 入 print(html data) 可 以 查看 最 新 上 映 影片 的 影讯 信息 ， 如 
图 20-6 所 示 。 

然后 对 得 到 的 HTML 代码 进行 解析 ， 提 取出 目 己 需要 的 数据 。 在 Python 中 使 用 
BeautifulSoup 库 〈 如 果 没 有 则 使 用 pip install BeautifulSoup 进行 安装 ) 进行 HTML 代码 的 
解析 。 
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《hy id= nowplayine > 
《dy class="mod-hd > 
<h2> 正 在 上 遇 <7h2> 
</div> 
《HHy class mod-bd > 
“UL class= 11sts > 
<11 

1 中 06390825 
class=" list-item 
dat a-title=" 黑 和 ]” 
dat a-score=" 6.8" 
dat a-st ar="” 35 
dat a-release=" 2018" 
dait 扩 daration= "135 分 钟 ! 中 国 太 陆 ) 
dat a-region=" 美国” 
dztz 山 rector=" 瑞 思 ， 库 格 勒 " 
dat a-actors=" 查 德 维 克 : 博 斯 曼 / 露 皮 塔 :' 尼 永 奥 / 巧 克 泵 :5 乔丹 
data-category=" nowplayine” 
dat a-enoueh=" True” 
dat a-showed=" True” 
dat a-votecoumt=" 6d156” 
data-subject=" 6390825" 


图 20-6 最 新 上 映 影片 的 影讯 信息 


BeautifulSoup 使 用 的 格式 如 下 : 


BeautifulSoup (htm]l, "htm]l .parser") 


第 1 个 参数 为 需要 提取 数据 的 HIML， 第 2 个 参数 是 指定 解析 器 ， 然 后 使 用 find all() 
读 取 HIML 中 的 内 容 。 

但 是 HIML 中 有 那么 多 的 标签 ， 该 读 取 哪些 呢 ? 其 实 ， 最 简单 的 办 法 是 打开 怜 取 网 页 
的 HIML 代码 ， 然 后 查看 需要 的 数据 在 哪个 HIML 标签 里 面 ， 如 图 20-6 所 示 。 

由 图 20-6 可 以 看 出 ， 从 <div id="mnowplayine 人 > 标签 开始 是 想 要 的 数据 , 里 面 有 电影 的 名 

from bs4 import BeautifulSoup as bs 

soup=bs (html data, ‘html .parser") 

nowplaying movie=soup.find alll('div', id="'nowplaying') 

nowplaying movie list=nowplaying moviel[0] .find all('l1li', class = 

"11st-1Item' ) 
其 中 , nowplaying movie list 是 所 有 电影 信息 的 一 个 列表 , 可 以 用 print(nowplaying movie 
list[1]) 碍 看 第 2 部 影片 《红海 行动 》 的 内 容 ， 如 图 20-7 所 示 。 

从 该 图 中 可 以 看 到 在 data-subject 属性 里 面 放 了 电影 的 了 D 号 , 而 在 img 标签 的 alt 属性 
里 面 放 了 电影 的 名 字 ， 因 此 通过 这 两 个 属性 来 得 到 电影 的 ID 和 名 称 〈 在 打开 电影 短评 的 
网 页 时 需要 用 到 电影 的 ID， 所 以 需要 对 它 进行 解析 )， 编 写 代 人 码 如 下 : 


nowplaying list=[] 
for item in nowplaying movie list: 


nowplaying dict={} # 以 字典 形式 存储 每 部 电影 的 ID 和 名 称 
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nowplaying dict['1d']=1Item['"qata-sSsubject' ] 

for tag img item in item.find al1(" Img'") : 
nowplaying dict['name']=tag img item["'alt'] 
nowplaying list.append (nowplaying dict) 


<]1i 
id"26861685" 
class=" list-item 
dat a-titl1e=" 基 了 海 行 动 “ 
data-score="8,.5" 
data-star=" 45” 
data-release=" 2018" 
dat a-duration="”138 分 钟 “ 
data-regiom=" 中 国 大 陆 香港“ 
dat zr- 山 rector=" 林 超 贤 " 
dat a-actors=" 张译 / 苏 景 瑜 / 海 清 ” 
data-category=" nowplaying” 
dat a-enough=" True” 
dat a- showed=" True” 
dat a-votecowmt=" 312987" 
data-subject=" 268616865” 


<ul class="“> 
《11 class= poster > 
《a href="https://movie. douban. com/ sub ject/26861685/ ?Ff romplaying poster” class-ticket-btn target=”blark” data-psource="poster” > 
《img src-"https://ime3. doubanio. com/’view/photo/s ratio poster/public/p2514119443. webp”alt=" 嫌 海 行动 ”rel="nofollow” class="" /> 
《7a> 
《7]1> 
<li class=" stitle”> 
<a href="https://movie. douban. com/subject/26861685/ ?fF roncplaying_poster” 
class=" ticket-btn” 
tareet="_blank” 
t 让 1e=" 记 海 行动 
data-psource="title”> 
行 去 


</a> 
《Ai> 


图 20-7 《红海 行动 》 电 影 信 息 的 HIML 标签 


在 列表 nowplaying_ list 中 存放 了 最 新 电影 的 ID 和 名 称 , 可 以 使 用 print(nowplaying_list) 
进行 租 看 ， 结 果 如 下 : 


TT md lnm nan Or 红 汪 和 0s 
[Er "26690897" "Tame" "同人 稳 环 于 27122171d 26393561 "name I 
小 葛 莉 的 猴 神 大 叔 '}，{'id': '26649604'，'name': ' 比 得 锡 "}，{'id': '26603666',， 
'name' : ' 妈 妈 咪 鸭 '}，{'id': '30152451'，'name': "厉害 了 ， 我 的 国 '}，{'id' : 
D2 mn nn 2 
{'id': '27176717'，'"'name': ' 熊 出没 -变形 记 '}，{'id': '26611804'，'name': 
' 三 块 广告 牌 '}，{'id': '25829175'，"'name' :' 西 游记 女儿 国 '},，{'id': '27085923'， 
'name"' : "灵魂 当铺 之 时 间 典 当 '}，{"id': '27114417'， 'name': "祖宗 十 九 代 '}， 
Eid 255993342 "name > tid 3036465 name: 
' 爱 在 记忆 消逝 前 '}，{'id': '27180882'，,，'"'name' :' 疯 狂 的 公牛 '}, {'id': '25856453',， 
'name': ' 闭 蜜 2'}，{'id': '26836837'，'"'name': ' 宇 宙 有 爱 浪 漫 同 游 ' }] 
可 以 看 到 是 和 豆 办 网 址 上 面 匹 配 的 ， 这 样 就 得 到 了 最 新 电影 的 信息 。 接 下 来 对 最 新 电 
影 短评 进行 分 析 。 例 如 《红海 行动 》 的 短评 网 址 为 “https:/movie.douban.comy/subject/ 
26861685/comments?start=0&limit=20”， 其 中 26861685 就 是 《红海 行动 》 电 影 的 ID, start=0 
表示 第 0 条 评论 。 
查看 上 和 面 的 短评 页 和 面 的 HTML 代码 ， 可 以 友 现 天 于 《红海 行动 》 评 论 的 数据 在 div 标 
俭 的 comment 属性 下 面 ， 如 图 20-8 所 示 。 
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<div class=" comment”> 


<span class=" comment-vote” > 
<span class="votes" 8801</span> 
Sinput value="1323425806” type="hidden’/> 
Ca href="javascript::” class="j a show login” onclick=""3 有 用 4a> 
fspan> 
<span class="comment-info”> 
<a href="https:/ /www, douban, com/people/ dreamfox/” class= “> 乌鸦 火 党 从 a> 
<span) 着 过 span> 
《span class="allstar40 ratine”+itle=" 推 荐 “></span> 
<span class=" comment-time ”title="2018-02-13 15:35:16"> 
2018-02-13 


<p class=""》 春 节 档 最 好 ! 最 好 不 是 战 狠 而 是 战争 ， 有 点 类 似 里 应 人 坠 落 ， 主 旋律 色彩 下 ， 真 实 又 残 醋 的 战争 党 染 。 夏 事 性 不 强 ， 文 戏 不 超 20 分 钟 ， 从 头 打 到 尾 ， 林 超 紧 场 面 周 度 极 
佳 ， 巷 战 、 偷 葵 、 突 击 有 条 不 训 ， 军 械 武 问 展 示 效 果 不 错 。 尺 度 超大 ， 祝 锯 恰 式 血肉 枢 飞 ， 还 给 你 看 特写 ! 笋 人 如 丧尸 一 般 打 不 完 ， 双 方 的 狙击 手 都 是 亮点 
p> 
div> 


图 20-8 《红海 行动 》 短 评 信息 的 HIML 标签 


因此 对 该 标签 进行 解析 ， 代 人 码 如 下 : 

requrl='https://movie.douban.com/subject/' + nowplaying list[0]["'id'] + 

'/comments"' +'?2"' +'start=0" + '&]limit=20" 

resp=request .urlopen (requrl]l) 

html data=resp.read() .decode ("utf-8°") 

soup=bs (html data, ‘html .parser") 

comment div lits=soup.find all('div', class ="'comment') 

此 时 在 comment div_lits 列表 中 存放 的 就 是 class ='comment' 的 所 有 div 标签 里 面 的 HIML 
代码 了 。 在 图 20-8 中 还 可 以 发 现 <div class_ ='comment> 标 签 里 面 的 p 标签 下 面 存 放 了 网 友 
对 电影 的 评论 ， 因 此 对 comment_div_lits 代码 中 的 HTML 代码 继续 进行 解析 ， 代 码 如 下 : 

eachCommentList [Tis 

for item in comment div lits: 


if item.find alll('p') [0] .string is not None: 


eachCommentList.append(item.find alll('p') [0] .string) 


使 用 print(eachCommentList) 查 看 eachCommentList 列表 中 的 内 容 ， 可 以 看 到 里 面 存 放 
了 大 家 想 要 的 影评 。 

至 此 已 经 人 息 取 了 豆 光 电影 最 近 播 放电 影 的 评论 数据 ， 接 下 来 就 要 对 数据 进行 清洗 和 词 
到 有 闻 不。 

@ 数据 清洗 

数据 清洗 是 消去 与 数据 分 析 无 天 的 信息 ， 这 里 为 了 方便 进行 数据 清洗 ， 将 列表 中 的 数 
据 放 在 一 个 字符 串 中 ， 代 人 码 如 下 : 

comments="" 


for k ln range(len (eachCommentL1Ist) ) : 


comments=comments + (str (eachCommentL1ist[Kk])) .strlip() 


使 用 print(comments) 进 行 查 看 ， 可 以 看 到 所 有 的 评论 已 经 变 成 一 个 字符 串 ， 但 是 评论 
中 还 有 很 多 标点 符号 等 。 这 些 符号 对 词 频 统计 根本 没 用 ， 因 此 要 将 它们 清除 ， 所 用 的 方法 
是 使 用 正则 表达 式 ，Python 中 的 正则 表达 式 是 通过 re 模块 实现 的 。 其 代码 如 下 : 
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import re 
pattern=re.compile(r'[\u4e00-\u9fa5]+") 
filterdata=re.findall (pattern, comments) 


cleaned comments="' .Join(filterdata) 


继续 使 用 print (cleaned_comments) 语句 进行 得 看 ， 可 以 看 到 此 时 评论 数据 中 已 经 没 
有 那些 标点 人 符 写 了 ， 数 据 被 清 “ 干 滔 ” 了 了。 

因为 要 进行 词 频 统计 ， 所 以 先进 行 中 文 分 词 操 作 。 在 这 里 使 用 的 是 jieba 分 词 ， 如 果 用 
户 没 有 安装 jieba 分 词 ， 可 以 在 控制 台 使 用 pip install jieba 进行 安装 (可 以 使 用 pip list 查看 
是 否 安 装 了 这 些 库 )。 中 文 分 词 的 代码 如 下 : 


import jieba.analyse # 分 词 包 
# 使 用 jieba 分 词 进行 中 文 分 词 
result=jieba.analyse.textrank (cleaned comments,topK=50,withWeight=True) 
keywords=dict () 
for 1 in result: 
keywords[i[0]]=i[1] 
print ("删除 停 用 词 前 ", keywords) 


结果 如 下 : 


{" 大 片 ": 0:28764823530539835, 动作" - 0-42333889433557714，“ 人 质 " : 
0.18041389646505365， ' 不 能 ': 0.18403284248005652， "行动 ' : 
0.5258110409848542，' 的 ': 0.19000741337241692，' 看 到 ' : 0.16410604936619055， 
"0 2503085877013413>0 二 02324767202789734971 守信” 
0.22827987403008904，' 主 旋律 ': 0.21300534948534544，' 电 影 ': 1.0， "作战 ' : 
0.17912699218043704，' 震 撼 ': 0.24439586499277743， ' 国 产 ' : 
0.37209344994813087，' 人物 ': 0.3211015399811397，' 红 海 ': 0.2759713023909607， 
' 有 点 ': 0.19442262680122022，' 节 奏 ': 0.28504415161934643， ' 战 争 片 ' : 
0.305141973888238，:! 战 争 ' : 0.38941165361568963，' 爆 破 ': 0.17280424905747072， 
' 演 员 ': 0.18291268026465418， ' 全 程 ': 0.1812416074586381，' 湄 公 河 ': 
0.4937422787186316，,，' 还 有 ': 0.17809860837238478，' 个 人 ': 0.2610284731772877， 
' 黑 记 险 落 ': 0.21305500057787405，' 剧 情 ': 0.21982545428026873， ' 战 狼 ' : 
0.611947562855697，' 从 头 !: 0.21612064060347713，' 文 戏 ' : 0.38037163533740115， 
"军事 ' : 0.39830147699101087， ' 好 看 ': 0.1843800611024451，“ 觉得 ' : 
0.18438026420714343，' 坦 克 ' : 0.2103294696884718，' 海 军 ': 0.2780877491487478 ， 
' 黄 景 ': 0.2762848729539791，' 喜 欢 ': 0.186512622392206， ' 好 莱 坞 ' : 
0.3041242625437134， ' 狙 击 手 ' : 0.4529383170599891,…】 


从 结果 可 以 看 到 进行 词 频 统计 了 ， 但 数据 中 还 有 “ 太 ”“ 的 ”等 虚词 〈 停 用 词 )， 这 些 
词 在 任何 场景 中 都 是 高 频 词 ， 并 且 没 有 实际 的 含义 ， 所 以 要 把 它们 清除 。 

本 程序 把 停 用 词 放 在 一 个 名 为 stopwords.txt 的 文件 中 , 将 数据 与 停 用 词 进行 比 对 即 可 。 
删除 停 用 词 的 代码 如 下 : 


keywords={x:keywords[x] for x in keywords if x not in stopwords} 
print ("删除 停 用 词 后 ", keywords) 
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继续 使 用 print0 语 句 查 看 结果 ， 可 见 停 用 词 已 经 被 清除 了 。 

由 于 前 面 只 是 爬 取 了 第 1 页 的 评论 ， 所 以 数据 有 点 少 ， 在 最 后 给 出 的 完整 代码 中 和 扑 取 
了 10 页 的 评论 ， 所 得 数据 比较 有 参考 价值 。 

全 用 词 云 进 行 显示 


import matplotlib.pyplot as pilt 

import matplotlib 
matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 
from wordcloud import WordCloud # 词 云 包 

# 指 定 字体 类 型 、 字 体 大 小 和 字体 颜色 
wordcloud=WordCloud (font path="simhei.ttf",background color="white", 
max font size=80,stopwords=stopwords) 

word frequence=keywords 

myword=wordcloud.fit words (word frequence) 
plt.imshow (myword) # 展 示 词 云图 
一 

plt.show() 


其 中 ，simheittf 用 来 指定 人 字体， 用户 可 以 在 百度 上 输入 simhei.ttf 进行 下 载 ， 然 后 放 入 程序 
的 根 目 录 中 。 
完整 的 程序 代码 如 下 : 


import warnings 


warnings.filterwarnings ("ignore") 


import Jieba # 分 词 包 
import JjJieba.analyse 
import numpy #numpy 计算 包 


import re 

import matplotlib.pyplot as plt 

from urllib import request 

from bs4 import BeautifulSoup as bs 

import matplotlib 

matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 

from wordcloud import WordCloud # 词 云 包 

# 分 析 网 页 函数 

def getNowPlayingMovie 11st() : 
resp=request.urlopen('https://movie.douban.com/nowplaying/ 
zhengzhou/') 
html data=resp.read() .decode ('utf-8") 
Soup=bs (html data, “html .parser'") 
nowplaying movie=soup.find all('div', id='nowplaying') 
nowplaying movie list=nowplaying movie[0] .find all('li', class = 
']1i1st-item') 
nowplaying list=[] 
for item in nowplaying movie list: 
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nowplaying dict=1{} 
nowplaying dict['"'id']=item['data-subject'] 
for tag img item in item.find all('img'): 
nowplaying dict['name']=tag img Item['alt'] 
nowplaying list.append (nowplaying dict) 
return nowplaying list 


# 疏 取 评 论 函 数 
def getCommentsById (movieId，pageNum) : # 参 数 为 电影 id 号 和 要 爬 取 评论 的 页 码 


GacneConmenEEastE Ts 
if pageNum>0: 
start= (pageNum—1)*20 
else: 
return False 
requrl="'https://movie.douban.com/subject/' + movielId + '/comments' 
De i pe oh el a he 
print (requrl) 
resp=request .urlopen (requrl]l) 
html data=resp.read() .daecode (" utft-8 ") 
Soup=bs (html data, "html .parser') 
comment div lits=soup.find alll('div', class ="'comment') 
for item in comment div lits: 
if item find all('p’}yI0l:.string 15 not None: 
eachCommentList.append (item.find alll('p') [0] .string) 


return GachComentList 


deT minfty: 


# 循 环 获取 第 2 个 电影 的 前 10 页 评论 

commentList=[] 

NowPlayingMovie list=getNowPlayingMovie list'() 

For in eaelidol # 前 10 页 
num=1 + 1 
commentList temp=getCommentsById (NowPlayingMovie list[1]["'id'], 
num) # 指 定 哪 部 电影 。 因 为 索引 号 从 0 开始 ， 所 以 是 第 2 个 电影 。numb 是 爬 取 哪 一 页 评论 
commentList.append (commentList temp) 

# 将 列表 中 的 数据 转换 为 字符 串 

comments="" 

for k in range(len (commentList)): 
comments=comments+(str (commentList[k])).strip() 

# 使 用 正则 表达 式 去 掉 标 点 符号 

pattern=re.compile(r'[\u4e00-\u9fa5]+"') 

filterdata=re.findall (pattern, comments) 

cleaned comments="'"'.]Join(filterdata) 

# 使 用 jieba 分 词 进行 中 文 分 词 

result=jieba.analyse.textrank (cleaned comments,topK=50, 

withWweight=True) 

keywords=dict () 
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for 1 in result: 
keywords [1I[0]]=1[1] 
print ("删除 售 用 词 前 ", keywords) #{' 演 员 ' :0.18290354231824632,' 大 片 ': 
#0.2876433001472282} 
# 停 用 词 集合 
stopwords=set (STOPWORDS) 
f=open('./StopWords.txt"',encoding="utf8") 
while True: 
uord FE readlinet} 
if word=="": 
break 
SEormmaords .add(woradl: 111} 
print (stopwords) 
keywords={x:keywords[x] for x in keywords if x not in stopwords} 
print ("删除 停 用 词 后 ", keywords) 
# 用 词 云 进行 显示 
wordcloud=WordCloud (font path="simhei.ttf",background color="white", 
max font size=80,stopwords=stopwords) 
word frequence=keywords 
myword=wordcloud.fit words (word frequence) 
plt.imshow (myword) # 展 示 词 云图 
下 二 
plLt.show() 
# 主 函数 


main() 


程序 运行 后 显示 的 图 像 如 图 20-9 所 示 。 


Figurel 


事 " 剧情 
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